hdfs 相关问题

Hadoop分布式文件系统(HDFS)是Apache Hadoop使用的默认文件存储系统。 HDFS创建多个数据块副本,并将它们分布在整个集群中的数据节点上,以实现可靠的计算,并计算商用硬件上的大量数据。

Sqoop 导入 HBase - SQL 数据库

我想将我的数据从SQL数据库迁移到HBase。我的问题之一是我的 SQL 表没有主键,因此要克服这个问题。我在 Sqoop 查询中使用复合键。我已经成功了

回答 1 投票 0

使用 hadoop 时出现错误“无法从 /webhdfs/v1/ 检索数据?op=LISTSTATUS:服务器错误”

我打开了localhost:9870并尝试将txt文件上传到hdfs。 我看到下面的错误消息 无法从 /webhdfs/v1/ 检索数据?op=LISTSTATUS:服务器错误

回答 6 投票 0

HiBench运行错误hibench.hadoop.examples.jar not found

我正在尝试使用 Intel 的 HiBench 在 gcp 上构建工作负载。我成功地构建了maven项目,并且我确实设置了如下配置: hadoop.conf: # Hadoop 主页 hibench.hadoop....

回答 1 投票 0

Hadoop:如何解决 docker 容器中的错误“无法上传文件”

Hadoop 使用 docker-compose.yml 在本地计算机上运行。并尝试从Web UI上传文件到HDFS,但出现以下结果: 无法上传文件 bar.txt 症状 跟随...

回答 2 投票 0

如何将操作转移到Secondary名称节点?

我有一个三节点 HDFS 集群,其中包含一个名称节点/数据节点、一个辅助名称节点/数据节点和一个数据节点。 我的主名称节点在火灾中被烧毁,但其他两个都很好。我如何转移到...

回答 1 投票 0

执行HDFS cp命令时抛出CalledProcessError throw subprocess.check_output

我在使用 subprocess.check_output 函数运行 HDFS cp 命令时遇到了 CalledProcessError 。下面是我的程序的示例。 >>导入子流程 >>命令=“hdfs...

回答 1 投票 0

hadoop.tmp.dir 应该是什么?

Hadoop 有配置参数 hadoop.tmp.dir,根据文档,它是“其他临时目录的基础”。我想,这个路径是指本地文件系统。 我将此值设置为...

回答 4 投票 0

在 HDFS 上写入会弄乱数据

我试图将 Hive 查询的输出保存在 HDFS 上,但数据发生了更改。任何想法? 请参阅下面的数据和更改后的数据。 删除文件名前的空格:) 正确的: 乱七八糟:

回答 1 投票 0

如何判断hadoop namenode是否已经格式化?

第一次配置我的hadoop namenode时,我知道我需要运行 bin/hadoop namenode -格式 但在将数据加载到 HDFS 后,第二次运行此操作将清除所有内容,

回答 2 投票 0

停用hdfs中的数据节点

我在 Apache hdfs 中有一些复制因子为 1 的数据节点,想要停用其中一些节点,并且不想丢失存储在其中的数据。 由于数据量太大,无法下载数据...

回答 1 投票 0

无需停机即可覆盖 Hive 表

我有一个与 HDFS 路径关联的配置单元表。该表被定期作业覆盖,并且有一些下游消费者。该表在被覆盖时会被删除,并且如果出现

回答 1 投票 0

HDFS 复制因子对 namenode 内存的影响

增加复制因子是否会增加 HDFS 中名称节点的内存使用量? 此链接指出复制因子对名称节点内存使用没有影响,但另一个链接指出不然。

回答 1 投票 0

hadoop 的名称节点和数据节点之间的集群 ID 不兼容

在 Windows 11 上,我安装了最新可用版本的 Docker Desktop。之后,我访问了官方 Apache Hadoop GitHub 存储库:https://github.com/apache/hadoop/tree/docker-had...

回答 1 投票 0

hadoop/hdfs/name 处于不一致状态:存储目录(hadoop/hdfs/data/)不存在或不可访问

我已经尝试了 stackoverflow 上提供的有关此主题的所有不同解决方案,但没有帮助 再次询问具体的日志和详细信息 任何帮助表示赞赏 我有一个主节点...

回答 7 投票 0

PutHDFS Nifi问题

早上好,我想创建一个从某个 URL 到我的 HDFS 的 Nifi 流。我使用我的个人构建和 Dockerfile 在本地创建了 HDFS 集群,它正在工作,但是当我尝试使用

回答 1 投票 0

在生产环境中部署时如何读取项目中的db.properties文件或任何其他conf文件......在scala Spark YARN HDFS中

在生产环境中部署时如何读取项目中的 db.properties 文件或任何其他 conf 文件......在 scala Spark Yarn HDFS 中...... 我收到这个错误... 2009 年 5 月 24 日 16:34:32 信息 客户: ...

回答 1 投票 0

Spark 基于多个分区(即 DATE_KEY 和 BASE_FEED)读取镶木地板文件

我正在使用 PySpark 从按 DATE_KEY 分区的 HDFS 位置读取镶木地板文件。以下代码始终从 MAX(DATE_KEY) 分区读取文件并转换为 Polars 数据帧。 定义

回答 1 投票 0

如何在Spark中检查HDFS目录是否为空

我正在使用org.apache.hadoop.fs来检查HDFS中的目录是否为空。我查找了 FileSystem api,但找不到任何接近它的东西。基本上我想检查目录是否...

回答 3 投票 0

awk 如何处理 HDFS 的目录?

我想将HDFS的目录名与awk结合起来。这可行吗?目录名,而不是文件名。 这是我在本地的 awk 工作正常: awk 'NR <= 1000 && FNR == 1{print

回答 1 投票 0

Hive 将数据存储在哪里?

我对 Hive 存储数据的位置有点困惑。 它将数据存储在 HDFS 还是 RDBMS 中? Hive Metastore 是否使用 RDBMS 来存储 Hive 表元数据?

回答 2 投票 0

最新问题
© www.soinside.com 2019 - 2025. All rights reserved.