hdfs 相关问题

Hadoop分布式文件系统（HDFS）是Apache Hadoop使用的默认文件存储系统。 HDFS创建多个数据块副本，并将它们分布在整个集群中的数据节点上，以实现可靠的计算，并计算商用硬件上的大量数据。

Sqoop 导入 HBase - SQL 数据库

我想将我的数据从SQL数据库迁移到HBase。我的问题之一是我的 SQL 表没有主键，因此要克服这个问题。我在 Sqoop 查询中使用复合键。我已经成功了

sql-server hadoop hbase hdfs sqoop

回答 1 投票 0

使用 hadoop 时出现错误“无法从 /webhdfs/v1/ 检索数据？op=LISTSTATUS：服务器错误”

我打开了localhost:9870并尝试将txt文件上传到hdfs。我看到下面的错误消息无法从 /webhdfs/v1/ 检索数据？op=LISTSTATUS：服务器错误

hadoop hdfs

回答 6 投票 0

HiBench运行错误hibench.hadoop.examples.jar not found

我正在尝试使用 Intel 的 HiBench 在 gcp 上构建工作负载。我成功地构建了maven项目，并且我确实设置了如下配置： hadoop.conf： # Hadoop 主页 hibench.hadoop....

bash apache-spark google-cloud-platform hadoop hdfs

回答 1 投票 0

Hadoop：如何解决 docker 容器中的错误“无法上传文件”

Hadoop 使用 docker-compose.yml 在本地计算机上运行。并尝试从Web UI上传文件到HDFS，但出现以下结果：无法上传文件 bar.txt 症状跟随...

docker hadoop docker-compose hdfs

回答 2 投票 0

如何将操作转移到Secondary名称节点？

我有一个三节点 HDFS 集群，其中包含一个名称节点/数据节点、一个辅助名称节点/数据节点和一个数据节点。我的主名称节点在火灾中被烧毁，但其他两个都很好。我如何转移到...

hadoop hdfs disaster-recovery

回答 1 投票 0

执行HDFS cp命令时抛出CalledProcessError throw subprocess.check_output

我在使用 subprocess.check_output 函数运行 HDFS cp 命令时遇到了 CalledProcessError 。下面是我的程序的示例。 >>导入子流程 >>命令=“hdfs...

python-2.7 apache-spark pyspark hdfs

回答 1 投票 0

hadoop.tmp.dir 应该是什么？

Hadoop 有配置参数 hadoop.tmp.dir，根据文档，它是“其他临时目录的基础”。我想，这个路径是指本地文件系统。我将此值设置为...

hadoop hdfs config

回答 4 投票 0

在 HDFS 上写入会弄乱数据

我试图将 Hive 查询的输出保存在 HDFS 上，但数据发生了更改。任何想法？请参阅下面的数据和更改后的数据。删除文件名前的空格:) 正确的：乱七八糟：

hive hdfs

回答 1 投票 0

如何判断hadoop namenode是否已经格式化？

第一次配置我的hadoop namenode时，我知道我需要运行 bin/hadoop namenode -格式但在将数据加载到 HDFS 后，第二次运行此操作将清除所有内容，

hadoop hdfs

回答 2 投票 0

停用hdfs中的数据节点

我在 Apache hdfs 中有一些复制因子为 1 的数据节点，想要停用其中一些节点，并且不想丢失存储在其中的数据。由于数据量太大，无法下载数据...

hadoop hdfs

回答 1 投票 0

无需停机即可覆盖 Hive 表

我有一个与 HDFS 路径关联的配置单元表。该表被定期作业覆盖，并且有一些下游消费者。该表在被覆盖时会被删除，并且如果出现

apache-spark hive hdfs overwrite

回答 1 投票 0

HDFS 复制因子对 namenode 内存的影响

增加复制因子是否会增加 HDFS 中名称节点的内存使用量？此链接指出复制因子对名称节点内存使用没有影响，但另一个链接指出不然。

hadoop hdfs namenode

回答 1 投票 0

hadoop 的名称节点和数据节点之间的集群 ID 不兼容

在 Windows 11 上，我安装了最新可用版本的 Docker Desktop。之后，我访问了官方 Apache Hadoop GitHub 存储库：https://github.com/apache/hadoop/tree/docker-had...

docker hadoop hdfs

回答 1 投票 0

hadoop/hdfs/name 处于不一致状态：存储目录(hadoop/hdfs/data/)不存在或不可访问

我已经尝试了 stackoverflow 上提供的有关此主题的所有不同解决方案，但没有帮助再次询问具体的日志和详细信息任何帮助表示赞赏我有一个主节点...

hadoop hdfs nodes

回答 7 投票 0

PutHDFS Nifi问题

早上好，我想创建一个从某个 URL 到我的 HDFS 的 Nifi 流。我使用我的个人构建和 Dockerfile 在本地创建了 HDFS 集群，它正在工作，但是当我尝试使用

hadoop hdfs apache-nifi data-ingestion

回答 1 投票 0

在生产环境中部署时如何读取项目中的db.properties文件或任何其他conf文件......在scala Spark YARN HDFS中

在生产环境中部署时如何读取项目中的 db.properties 文件或任何其他 conf 文件......在 scala Spark Yarn HDFS 中...... 我收到这个错误... 2009 年 5 月 24 日 16:34:32 信息客户： ...

scala hdfs hadoop-yarn

回答 1 投票 0

Spark 基于多个分区（即 DATE_KEY 和 BASE_FEED）读取镶木地板文件

我正在使用 PySpark 从按 DATE_KEY 分区的 HDFS 位置读取镶木地板文件。以下代码始终从 MAX(DATE_KEY) 分区读取文件并转换为 Polars 数据帧。定义

apache-spark pyspark hdfs python-polars pyarrow

回答 1 投票 0

如何在Spark中检查HDFS目录是否为空

我正在使用org.apache.hadoop.fs来检查HDFS中的目录是否为空。我查找了 FileSystem api，但找不到任何接近它的东西。基本上我想检查目录是否...

api apache-spark hadoop hdfs

回答 3 投票 0

awk 如何处理 HDFS 的目录？

我想将HDFS的目录名与awk结合起来。这可行吗？目录名，而不是文件名。这是我在本地的 awk 工作正常： awk 'NR <= 1000 && FNR == 1{print

shell awk hdfs

回答 1 投票 0

Hive 将数据存储在哪里？

我对 Hive 存储数据的位置有点困惑。它将数据存储在 HDFS 还是 RDBMS 中？ Hive Metastore 是否使用 RDBMS 来存储 Hive 表元数据？

hadoop hive hdfs create-table hive-metastore

回答 2 投票 0

hdfs 相关问题

最新问题