hadoop 相关问题

Hadoop是一个Apache开源项目,为可靠和可扩展的分布式计算提供软件。核心由分布式文件系统(HDFS)和资源管理器(YARN)组成。各种其他开源项目,例如Apache Hive,使用Apache Hadoop作为持久层。

聚合后用蜂巢表读取和写入

我们有一个蜂巢仓库,并希望使用spark来完成各种任务(主要是分类)。有时将结果写回蜂巢表。例如,我们将以下python函数写入...

回答 3 投票 6

使用spark-submit部署程序时的java.lang.NoSuchMethodError

我正在编写一个程序来将数据上传到某个s3a://链接。该程序是通过mvn install编译的。在本地运行程序(如使用java -jar jarfile.jar)没有返回任何错误。但是,......

回答 1 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.