hadoop 相关问题

Hadoop是一个Apache开源项目，为可靠和可扩展的分布式计算提供软件。核心由分布式文件系统（HDFS）和资源管理器（YARN）组成。各种其他开源项目，例如Apache Hive，使用Apache Hadoop作为持久层。

无法增加Max Application Master资源

我正在使用uhopper / hadoop docker image来创建纱线簇。我有3个节点，每个节点有64GB RAM。我添加了配置。我已经给了纱线32GB。总簇内存为96GB。 - ......

docker hadoop yarn

回答 2 投票 5

如何在Hortonworks沙箱Hadoop平台中运行mapreduce作业

我是Hadoop的新手。我已经安装了oracle虚拟盒并在虚拟机中安装了hortonworks沙箱的图像。此外，我已经在eclipse中编写了wordcount程序并尝试...

java hadoop

回答 1 投票 0

HDFS未检测到数据节点容量增加

我有一个由4个虚拟机（1个主服务器和3个从服务器）组成的虚拟hadoop集群，最近为集群中的数据节点增加了100GB容量。问题是HDFS没有检测到这个......

hadoop hdfs

回答 1 投票 0

无法将窗口调用分解为组。错误：org.apache.hadoop.hive.ql.parse

我正在尝试从两个表连接两列，以生成一列的唯一id.Max列值，其中包含另一个表的行号。从MPPO S中选择（MAX（S.m_id））;选择row_number（）OVER（ORDER ...

hadoop hive hiveql

回答 2 投票 1

Apache Spark错误使用hadoop将数据卸载到AWS S3

我正在使用Apache Spark v2.3.1并尝试在处理之后将数据卸载到AWS S3。像这样：data.write（）。parquet（“s3a：//”+ bucketName +“/”+ location）;配置似乎是......

java windows amazon-web-services apache-spark hadoop

回答 1 投票 1

我必须实现hadoop，所以它可以处理呼叫详细记录的数据？

我已经配置了HDFS，Datanode和namenode以及hbase。我在HDFS中存储了一个CDR csv文件。那么如何将其与Hbase映射并准备好进行处理呢？

hadoop hadoop-streaming hadoop2 hadoop-plugins hadoop-partitioning

回答 1 投票 -1

Spark＆Scala：saveAsTextFile（）异常

我是Spark＆Scala的新手，在调用saveAsTextFile（）后我得到了异常。希望有人可以帮忙...这是我的input.txt：Hello World，我是程序员Hello World，我是程序员这是......

scala apache-spark hadoop apache-spark-sql bigdata

回答 2 投票 5

Spark：内存繁重的连接操作的最佳实践

我有一个火花程序，涉及大型Hive表的连接操作（数百万行，数百列）。在这些连接期间使用的内存非常高。我想了解......

scala apache-spark hadoop pyspark yarn

回答 1 投票 0

你如何检查dfs中的目录

我在dfs中创建了一个名为/ foodir的目录来测试，如下所示：hadoop dfs -mkdir / foodir有人能告诉我这个/ foodir在哪里保存了吗？我该如何查看路径？我需要确定，它是......

hadoop hdfs

回答 1 投票 0

Hadoop用例场景

我希望在我的一个项目场景中对Hadoop等大数据平台的使用有一些专家意见。虽然我理解像......这样的数据库，但我是这项技术的新手。

hadoop bigdata hadoop2

回答 3 投票 2

在hdfs（namenode）中使用的命名空间和元数据的含义是什么

作为hadoop的初学者，我对这些单词命名空间和元数据感到困惑。这两者之间有什么关系吗？

hadoop namespaces metadata hdfs

回答 2 投票 7

如何将oracle表导入hive表

我试图使用sqoop将oracle表导出到hive表：sqoop import --connect jdbc：oracle：thin：@ ：1521： - 用户名 - 密码 - 表

hadoop hive sqoop

回答 2 投票 0

从CSV创建表，其值包含用引号括起来的逗号

我正在尝试使用我上传到HDFS目录的CSV在Impala中创建一个表。 CSV包含用引号括起来的逗号的值。示例：1.66.96.0 / 19，“NTT Docomo，INC。”，“......

sql hadoop impala

回答 2 投票 5

如何根据配置单元中的3列查找上一个日期值

我想基于3列找出目标表中的上一个日期值。附带的屏幕截图中解释了示例和场景。请帮忙。

hadoop hive hiveql

回答 2 投票 0

Row格式serde是创建Hive表时要使用的必需参数

我在文本文件的顶部创建了一个临时的hive表，如下所示：CREATE EXTERNAL TABLE tc（fc String，cno String，cs String，tr String，at String，act String，wa String，dn String，pnm String，rsk String，ttp ...

hadoop hive

回答 1 投票 0

如何在Spark提交中使用s3a和Apache spark 2.2（hadoop 2.8）？

我正在尝试使用使用hadoop 2.8版本构建的spark 2.2.0从spark访问S3数据，我使用的是/jars/hadoop-aws-2.8.3.jar,/ jars / aws-java-sdk-s3- 1.10.6.jar和/ jars / aws-java-sdk -...

scala apache-spark hadoop amazon-s3 pyspark-sql

回答 1 投票 0

Hadoop 2.9 MultiNodes

我有3台服务器Centos 7（防火墙和selinux禁用）chadoop1（主机），chadoop2（从机）和chadoop3（从机）当我开始服务，节点没有，我在jps上看到，不显示DataNode和NodeManager ... 。

hadoop

回答 1 投票 0

如果我们使用Hadoop处理大数据，那么数据会存储在哪里因为hadoop数据库HBase存储结构化数据而大数据是非结构化数据

Hadoop用于处理大数据，hadoop使用HBase作为其数据库，但BigData可能80％是非结构化的，HBase仅存储结构化数据。非结构化数据存储在哪里？要么 ...

hadoop hbase

回答 1 投票 0

Sqoop命令 - 缺少选项的参数：merge-key

使用cloudera中sqoop命令中的lastmodified和--merget-key选项进行表导入。它在执行命令时抛出缺少的参数异常。这是我的命令[cloudera @ quickstart~] ...

apache-spark hadoop sqoop sqoop2

回答 1 投票 0

我们如何仅从hdfs联合中的一个名称空间中排除某些数据节点？

我正在检查hadoop联合会。这里的数据节点很常见，只有命名空间才不同。我们如何只从一个命名空间中排除某些数据节点。

hadoop hive hbase namenode datanode

回答 1 投票 0

hadoop 相关问题

最新问题