hdfs 相关问题

Hadoop分布式文件系统(HDFS)是Apache Hadoop使用的默认文件存储系统。 HDFS创建多个数据块副本,并将它们分布在整个集群中的数据节点上,以实现可靠的计算,并计算商用硬件上的大量数据。

apache spark - 检查文件是否存在

我是新手,我有一个问题。我有一个两步过程,第一步是将SUCCESS.txt文件写入HDFS上的某个位置。我的第二步是火花工作必须验证是否......

回答 6 投票 18

根据hdfs目录中的文件名计算文件数

我有一个包含超过千条记录的HDFS目录,其中包含不同的文件名。我必须根据文件名计算文件。由于我有数千个文件,我不能给出具体的...

回答 1 投票 -2

hadoop 2.5.0无法启动datanode

我正在尝试部署一个独立版本的hadoop 2.5.0。但Datanode无法启动。日志打印:2014-10-20 13:42:13,288致命org.apache.hadoop.hdfs.server.datanode.DataNode:异常...

回答 2 投票 2

我应该把程序放在HDFS上吗?

我应该把程序放在HDFS上还是保持本地化?我在谈论一个二进制文件:由spark-submit启动每天执行执行火花图减少RDD / Dataframes上的函数是一个JAR ...

回答 1 投票 -1

我应该如何在spark文本文件中表达hdfs路径?

我想加载像path这样的数据:hdfs:// dcoshdfs / encrypt_data / gmap_info / 2019-02-04 / * / * hdfs:// dcoshdfs / encrypt_data / gmap_info / 2019-02-05 / * / * hdfs:// dcoshdfs / encrypt_data / gmap_info / 2019-02-06 / * / * hdfs:/ ...

回答 2 投票 2

Azure ADLS Gen2不可用

我正在尝试使用Data Lake Gen2预览创建Storage v2帐户,但它已从Azure向导中禁用。据我所知,它应该适用于此设置?

回答 1 投票 3

如何将hdfs权限授予超级组?

为了访问hdfs。我不知道在root用户中给出了以下命令。(我曾尝试解决以下错误)sudo su - hdfs hdfs dfs -mkdir / user / root hdfs dfs -chown root:hdfs / user / ...

回答 1 投票 0

hdfs dfs -put with overwrite?

我正在使用hdfs dfs -put myfile mypath和一些文件我得到:'myfile':文件存在这意味着有一个同名的文件或者这意味着相同的文件(大小,内容)...

回答 4 投票 19

HDFS如何存储大于块大小的单个数据?

如果我的一个数据超过块大小,hadoop将如何拆分数据?例如。数据(谈论单个记录)我存储的大小为80 mb,块大小为64 mb,所以如何...

回答 1 投票 0

如何在HDFS中查找文件的创建日期

我需要在hdfs目录中找到文件或文件夹的创建日期。例如:hadoop fs -ls / user / myUser /我在路径/ user / myUser /中得到一个文件和目录列表,其中包含...

回答 1 投票 1

如何修复spark unsafe.types.UTF8String.numBytesForFirstByte抛出java.lang.ArrayIndexOutOfBoundsException?

当我使用sparkSql接口从HDFS读取数据时,一些任务抛出java.lang.ArrayIndexOutOfBoundsException。我认为数据集中可能存在一些不良记录,导致任务失败。 ...

回答 2 投票 1

当更改到新的一天的目录后,Flume在HDFS中留下.tmp文件

我正在使用Flume 1.7.0和HDFS接收器。我将Flume配置为将数据放入HDFS的日期目录中,以便在新的一天到来时自动更改目录。问题是我设置了水槽......

回答 1 投票 0

如何将文件从Hdfs强制复制到linux文件系统?

对于命令,-copyFromLocal有一个带-f的选项,它会强制将数据从本地文件系统复制到Hdfs。与-copyToLocal选项类似,我尝试使用-f选项但是,它没有......

回答 1 投票 -1

访问正在写入的文件

使用hadoop fs -put命令编写300 MB文件,HDFS块大小为64 MB。在此命令完成写入200 MB此文件后,其他用户在尝试时会看到什么...

回答 3 投票 9

Spring Cloud Dataflow - http |卡夫卡和卡夫卡| hdfs - 在HDFS中获取原始消息

我在SCDF(本地服务器1.7.3)中创建基本流,其中我正在配置2个流。 1. HTTP - > Kafka主题2. Kafka主题 - > HDFS流:流创建--name ingest_from_http --...

回答 1 投票 0

大数据Hadoop HDFS - put命令

我无法将文件从本地复制到HDFS。该命令会抛出这些错误。

回答 2 投票 0

有没有办法将节点添加到正在运行的Hadoop集群?

我一直在玩Cloudera,我在开始工作之前定义了簇的数量,然后使用cloudera管理器确保一切都在运行。我正在开发一个新项目......

回答 5 投票 14

添加新数据节点 - 在新节点上格式化?

我已经建立了一个非常简单的Hadoop集群,其中包含3个虚拟机 - 一个充当NameNode,另外两个充当数据节点。我使用format命令创建了HDFS文件系统,一切正常....

回答 1 投票 1

如何将数据目录从hdfs复制到本地fs?

我开始需要使用以下命令备份整个hadoop datanode数据目录:hdfs dfs -copyToLocal / var / hadoop / dfs / name / data / home / ubuntu / hadoopfiles我收到一个错误:“没有这样的文件opr ...

回答 1 投票 0

Hive管道的设计

我试图找到在Hive和HDFS中实现以下管道的最佳方法:我想要摄取一个csv(到目前为止没有问题)但是,我想要从一个字段制作分区...

回答 1 投票 1

© www.soinside.com 2019 - 2024. All rights reserved.