hdfs 相关问题

Hadoop分布式文件系统（HDFS）是Apache Hadoop使用的默认文件存储系统。 HDFS创建多个数据块副本，并将它们分布在整个集群中的数据节点上，以实现可靠的计算，并计算商用硬件上的大量数据。

我有1Gb的文件在本地文件系统tmpdist_testfle，我可以复制它：hadoop fs -put file:/tmpdist_testfile maprfs:/，但不能distcp它。命令 hadoop distcp file:/tmpdist_testfile ...。

hadoop hdfs mapr distcp

回答 1 投票 0

如何用bash脚本管理hdfs中的目录？

最近我试着写了一个bash脚本来管理hdfs中的一些目录，以便与kafka一起工作。假设在hdfs中我们有一个这样的目录：tmpmy_dirstate=a，当我列出这个...

bash apache-kafka hdfs

回答 1 投票 0

WARN hdfs.DFSClient.DataStreamer Exception org.apache.hadoop.ipc.RemoteException(java.io.IOException):WARN hdfs.DFSClient: DataStreamer Exception org.apache.hadoop.ipc.RemoteException(java.io.IOException)。文件inrecipeitems-latest.json.ingeing_。

当我试图将json从本地路径复制到Hadoop文件分布式系统时，我遇到了一个问题。我已经按照这个链接http:/www.codeproject.com......中给出的步骤进行了编码。

json hadoop mapreduce hdfs hadoop-streaming

回答 1 投票 1

如何提高Spark的性能？

我有一个Java程序，工作与大型数据集。该数据集存储在hdfs（csv）中。该程序工作正常，但它是非常缓慢的。程序要做的是：加载csv文件单独一行到String[]过滤器......。

java apache-spark cassandra hdfs

回答 1 投票 0

如何在HDFS中用bash将带有元数据的文件列在一行？

我正在写一个bash脚本，用来扫描HDFS，并对输出结果进行处理。获取文件名很容易，如下： for line in $(hdfs dfs -ls -t -r -C -R $HDFS_CLEANING_STG); do ...

bash hadoop hdfs

回答 1 投票 0

能否合并hdfs上的两个parquet目录？

我在HDFS上有两个相同模式的parquet目录。我想把这两个目录合并成一个parquet目录，以便能够创建一个外部的hive表。我已经上网查了我的 ...

hive hdfs parquet

回答 1 投票 0

一个行键可以存在多个hbase区域中吗？

按照我的理解，HBase表按行键范围横向划分为 "区域"。一个区域包含了该区域起始键和结束键之间的表中所有行。假设我有一个...

java hadoop hdfs bigdata hbase

回答 1 投票 1

如何计算hdfs URI

如何弄清楚我的hdfs dfs命令连接的URI？有没有什么配置文件可以存储URI或任何命令可以用来显示它？我查了一下文档 ...

hadoop hdfs

回答 1 投票 0

Tez View - "下载数据 "文件位置

在Ambari中，在Tez视图中，每个查询内的 "详细信息 "窗格有一个下载数据按钮。如果有人按了这个按钮，它就会下载一个大约1MB的压缩文件，比如说，"......"。

logging hive hdfs apache-tez

回答 1 投票 1

Hadoop Docker容器只能复制到0个节点，而不是minReplication（=1）。

我尝试了不同的Hadoop容器的docker镜像，但当我尝试将文件写入HDFS时，它们都不工作。我总是得到错误信息。Caused by: org.apache.hadoop.ipc.RemoteException(java.io...)。

python docker hadoop hdfs

回答 1 投票 0

使用pySpark从hdfs中读取部分文件到数据框中。

我有多个文件存储在一个hdfs位置，如下 userproject202005part-01798 userproject202005part-01799 有2000个这样的部分文件。每个文件的格式为{'Name': ...

pyspark apache-spark-sql hdfs partitioning

回答 1 投票 0

Hadoop hdfs to elasticsearch

我如何从HDFS读取数据，然后将它们发送到Elasticsearch并显示在kibana仪表板上？我知道在ES-Hadoop中有一个连接器可以双向发送数据，但是......

hadoop elasticsearch hdfs kibana

回答 1 投票 0

如何计算hdfs URI

如何弄清楚我的hdfs dfs命令连接的URI？有没有什么配置文件可以存储URI或任何命令可以用来显示它？我查了一下文档 ...

hadoop hdfs

回答 1 投票 1

sqoop如何避免从HDFS导出重复数据到RDBMS？

HDFS以复制的形式存储数据，当我们使用SQOOP将数据从HDFS移动到RDBMS时，sqoop如何避免将重复的数据从HDFS导出到RDBMS？

hdfs sqoop

回答 1 投票 0

将Hive外部表的列名改为大写，并增加新的列。

我有一个外部表，例如dump_table，它是按年、月、日分区的。如果我运行show create table dump_table，我得到以下结果。CREATE EXTERNAL TABLE `dump_table` ( `... )

hadoop hive hdfs etl hiveql

回答 1 投票 0

flume在我要推送的hdfs文件中添加了一个随机数(test.csv > test.csv.1591560702234)

当我把一个文件放在本地目录下(vagrantflumetest.csv)，在HDFS中flume把它变成了(userinputstest.csv.1591560702234)，我想知道为什么HDFS增加了1591560702234，如何删除它! ...

hadoop hdfs flume

回答 1 投票 0

将消息从kafka存储到hdfs。

我正在使用confluent-Kafka与python。我想将Kafka连接到Hdfs，并将一些特定的数据直接存储在Hdfs中。我找到了confluent HDFS连接器，但我不知道如何将它与我的...

python apache-kafka hdfs apache-kafka-connect confluent-platform

回答 1 投票 0

MapR-FS中文件读写的解剖结构图

我想了解MapR-FS中文件读写的解剖结构是什么？我上网查了很多，但没有得到明确的了解，在MapR-FS中文件读写的步骤是什么。我还...

hadoop hdfs mapr

回答 1 投票 1

Hive与Hadoop vs Hive与spark vs spark sql vs HDFS - 它们之间如何工作？

我有点困惑，我应该使用哪种组合来实现我的目标，我需要在HDFS中存储数据，并需要根据查询的数据进行分析。如果我使用...

apache-spark hadoop hive apache-spark-sql hdfs

回答 1 投票 -1

客户端无法通过认证。[TOKEN,KERBEROS)

从我的火花应用程序，我试图distcp从hdfs到s3。我的应用程序对数据进行了一些处理，并将数据写入hdfs，而这些数据我正试图通过descp推送到s3。我面临以下错误....

apache-spark amazon-s3 hdfs kerberos distcp

回答 1 投票 -1

hdfs 相关问题

最新问题