hadoop 相关问题

Hadoop是一个Apache开源项目，为可靠和可扩展的分布式计算提供软件。核心由分布式文件系统（HDFS）和资源管理器（YARN）组成。各种其他开源项目，例如Apache Hive，使用Apache Hadoop作为持久层。

Hive 将数据存储在哪里？

我对 Hive 存储数据的位置有点困惑。它将数据存储在 HDFS 还是 RDBMS 中？ Hive Metastore 是否使用 RDBMS 来存储 Hive 表元数据？

hadoop hive hdfs create-table hive-metastore

回答 2 投票 0

带通配符的 Hive 外部表

我正在尝试创建一个外部 Hive 表，并将位置作为通配符。期望它能够遍历子目录。但不知何故它不起作用，而是用

hadoop hive

回答 1 投票 0

使用 pyspark，并下载了 hadoop-aws:3.3.4，我仍然收到“方案“s3”没有文件系统”错误

我在本地工作，使用以下方法构建spark_session：生成器 = SparkSession.builder \ .master("本地[8]") \ .appName("test_app") \ .config("sp...

amazon-s3 hadoop pyspark

回答 1 投票 0

datanode正在启动但在jps中没有显示

我在ubuntu中安装了hadoop，当我运行以下命令时：须藤苏 hduser cd /usr/local/hadoop/etc/hadoop sudo rm -R /应用程序/* sudo rm -R /tmp/* hadoop namenode-格式启动-dfs.sh &&

hadoop hadoop2

回答 1 投票 0

过滤掉非目录inode的hdfs审计日志

我正在使用logstash 将 HDFS 审核日志消息填充到 Kafka 主题中。我在 Kafka 主题中收到的示例消息具有以下格式： allowed=true ugi={myuser} (auth:SIMPLE) ip={/x.x.x...

hadoop apache-kafka hdfs logstash audit-logging

回答 1 投票 0

线程“main”中出现异常 java.lang.UnsatisfiedLinkError: org.apache.hadoop.io.nativeio.NativeIO$POSIX.stat(Ljava/lang/String;)

现在我想加载保存在路径中的spark管道模型（C:\Users\ASUS\Desktop\kaggl

apache-spark hadoop

回答 0 投票 0

hive 映射 mysql 表：在连接条件中选择不同的 mysql 数据源时无法成功

我使用jdbc存储处理程序将hive中的多个mysql数据源映射为https://cwiki.apache.org/confluence/display/Hive/JDBC+Storage+Handler；第一个表是：如果外部表不存在，则创建

mysql apache-spark hadoop hive

回答 1 投票 0

失败：语义分析错误：在多个表/子查询中找到列

创建外部表old_events （天 STRING、foo STRING、计数 STRING、internal_id STRING）分区依据（ds 字符串）行格式分隔以 ' ' 结尾的字段位置“${输入}”；创建 EX...

hadoop hive

回答 2 投票 0

如何将作业提交到Hadoop中的特定节点？

我有一个Hadoop集群，有1个Master和5个Slave。有什么方法可以将工作提交给特定的奴隶组吗？基本上我想做的是用许多可能性对我的应用程序进行基准测试......

hadoop mapreduce

回答 4 投票 0

启用 Kerberos 的 HDP 2.6 集群中 Storm HDFS Bolt 面临问题

我已在 HDP 2.6 集群中启用了 Kerberos 安全性，在启用 Kerberos 之前，在该集群上安装了 Kafka 和 Storm 服务。我正在运行的拓扑有 kafka-spout 和 hdfs...

hadoop apache-kafka apache-storm kerberos hadoop-streaming

回答 1 投票 0

为什么使用“schematool -initSchema”无法识别hive-site.xml中的“amps”

配置完Hive和mysql后，希望通过Hive自带的schematool工具来升级元数据。当我输入升级说明时，显示以下错误。我也我们...

java xml hadoop hive

回答 1 投票 0

Hadoop log4j 找不到 KafkaLog4JAppender.class

我在 MR 作业中添加了 KafkaLog4JAppender 功能。该作业正在本地运行并将格式化日志发送到我的 Kafka 集群中。当我尝试从纱线服务器运行它时，使用：罐子[罐子-...

java hadoop logging log4j apache-kafka

回答 2 投票 0

使用本地文件进行 Spark 流式处理（Python）

有没有办法扫描本地文件系统以查找特定文件夹中的更改，就像使用 HDFS （GitHub 示例）一样？使用常规路径或带有 hdfs:// 的 URI 运行它似乎可以工作，但是使用...

python hadoop apache-spark hdfs pyspark

回答 1 投票 0

运行 Spark-shell 时出现错误：SparkContext：初始化 SparkContext 时出错

我在三个节点上成功安装了spark。我可以访问 Spark Web UI 并发现每个工作节点和主节点都处于活动状态。我可以成功运行 SparkPi 示例。我的集群信息： 10.45.10.33(

hadoop apache-spark hdfs

回答 2 投票 0

Spark 建议列出文档中提供的 Spark 和 Hadoop 依赖项，这是严格要求的吗？

在 Spark 文档中，它指出：如果您的代码依赖于其他项目，则需要将它们打包与您的应用程序一起，以便将代码分发到 Spark 簇。为了做到这一点...

apache-spark hadoop hbase amazon-emr

回答 1 投票 0

问题无法找到 s3ablock-0001-

当我尝试在 S3 上写入数据时，我在 Amazon EMR 上运行作业时遇到问题。这是堆栈跟踪： org.apache.hadoop.util.DiskChecker$DiskErrorException：找不到任何有效的本地可怕...

apache-spark hadoop pyspark amazon-emr

回答 4 投票 0

nifi FlowFile 尚未关闭（Groovy 脚本）警告

nifi 术语和流文件处理的新内容。找到了一种处理传入 xml 并使用 XmlSlurper 解析它的便捷方法，但收到以下针对传入流文件的 GroovyScript 的警告...

hadoop groovy cloudera apache-nifi hortonworks-data-platform

回答 2 投票 0

在 avro 架构中使用“默认”

根据 Avro 文档中“默认”属性的定义：“此字段的默认值，在读取缺少此字段的实例时使用（可选）。” 这意味着如果相应的字段...

java hadoop serialization apache-kafka avro

回答 3 投票 0

如何将 sas7bdat 文件转换为 csv？

我想将 .sas7bdat 文件转换为 .csv/txt 格式，以便我可以将其上传到配置单元表中。我从外部服务器接收 .sas7bdat 文件，但我的计算机上没有 SAS。

csv hadoop hive sas hdfs

回答 6 投票 0

Flink 检查点因延迟相关错误而停顿和超时

最近，我升级了现有的 Flink 作业（之前运行 Flink 1.15）以针对官方 Flink Kubernetes Operator（针对 Flink 1.18）运行，并开始看到一些奇怪的行为...

hadoop apache-flink flink-streaming flink-checkpoint flink-kubernetes-operator

回答 1 投票 0

hadoop 相关问题

最新问题