hive 相关问题

Hive是Hadoop的数据仓库系统,可以简化数据汇总,即席查询以及分析存储在Hadoop兼容的分布式文件系统中的大型数据集。 Hive提供了一种机制,用于将结构投影到此数据上,并使用类似SQL的语言HiveQL查询数据。

Hive - 创建表 - 在 ')' 附近的 'SORT' 处缺少 EOF

当我尝试执行下面的查询(CREATE)时出现此错误。 有什么建议吗? 错误: - - - - - - - - - - - - - - - - - - - - - - - - ------------------------ [sshexec] 2022-08-22 11:48:36: >>

回答 1 投票 0

如何远程连接HIVE DB

我尝试从服务器 A 连接到服务器 B (HIVE),尝试了 JDBC,但最终出现错误 JDBC Hive2 Kerbros 无效状态 21 错误 检查时发现beeline可以用来连接HIVE...

回答 1 投票 0

升级impyla到0.12.0后出错

我曾经使用 impyla 0.9.0 连接到 impala。但是当我将 impyla 升级到 0.12.0 后,我被告知不再需要指定协议参数,因为 impyla 只支持 HiveServer...

回答 1 投票 0

无法让极坐标从 S3 404 未找到读取配置单元布局镶木地板文件

我正在努力通过极坐标从 S3 读取数据,但一直得到无用的信息 客户端错误,状态为 404 Not Found 数据分布在 S3 中,我认为是 Hive 分区(al...

回答 1 投票 0

带有溢出和 Alluxio 缓存的 Trino 向对象存储发出大量请求

我有 Trino、Hive Metastore 和 Minio 存储的本地设置。我已经在 Trino 上启用并配置了 Alluxio 缓存和磁盘溢出。对对象存储的请求数量更高

回答 1 投票 0

如何将 SparkDFDataset 添加到我的远大前程验证器中?

感谢您对以下问题的建议。 我正在测试远大前程是否可以在我的蜂巢表上使用。理想情况下,我想打开一个 html 文件,显示我对用户朋友的期望......

回答 1 投票 0

Apache Ranger 中基于标签的策略不起作用

我是 Apache Ranger 和大数据领域的新手。我正在研究本地大数据管道。我已经使用 ranger hive pl 在 Apache Ranger(版本 2.2.0)中配置了基于资源的策略...

回答 2 投票 0

Trino 负载测试返回 SERVICE_UNAVAILABLE

我正在 Trino 上运行一个简单的并发查询负载测试,大多数请求都成功。但是,失败的日志条目与以下日志条目相关: 2024-05-03 07:13:08 2024...

回答 1 投票 0

如何使用 Spark 数据框架的架构创建 Hive 表?

我想使用 Spark 数据帧的架构创建一个配置单元表。我怎样才能做到这一点? 对于固定列,我可以使用: val CreateTable_query = "创建表我的表(a string, b string, c double)"

回答 6 投票 0

Hive:窗口函数 - 如何排除当前行

我希望计算分区上值的最小值,但不应考虑当前行。 选择 *, MIN(val) OVER(按 col1 分区) 从表 输出最小值...

回答 2 投票 0

使用 HiveQL 删除前导零

我有一个字符串值,其中可能有前导零,所以我想删除所有前导零。 例如: accNumber =“000340”--->“340” Hive 中有可用的 UDF 吗?我们可以使用

回答 3 投票 0

DuckDB 将 hive 分区插入 parquet 文件中

我有按 user_id 和 report_date 分区的 jsonl 文件。我将这些 jsonl 文件转换为 parquet 文件,并使用 DuckDB 中的以下命令将它们保存在同一文件夹中 jsonl_file_p...

回答 1 投票 0

在 hive 中加载一个以逗号作为分隔符的 csv,其中一列不带引号的字符串可以在其中包含逗号

目标:将给定的 .csv 加载到 hive 中。 问题:.csv 中的一个未加引号的字符串列在某些行中包含逗号。这会产生逗号多于列的行,从而导致数据错误......

回答 1 投票 0

Hive 将数据存储在哪里?

我对 Hive 存储数据的位置有点困惑。 它将数据存储在 HDFS 还是 RDBMS 中? Hive Metastore 是否使用 RDBMS 来存储 Hive 表元数据?

回答 2 投票 0

如何在hive中获取季度的最后一天

我正在尝试使用配置单元获取季度的第一个和最后一个日期。 对于本季度的第一天,效果很好: 选择 trunc(add_months(from_unixtime(unix_timestamp())),-(月(from_unixtime(

回答 1 投票 0

带通配符的 Hive 外部表

我正在尝试创建一个外部 Hive 表,并将位置作为通配符。期望它能够遍历子目录。但不知何故它不起作用,而是用

回答 1 投票 0

Docker Compose 上的 Trino、Hive Metastore、MinIo 无法创建外部路径 s3a:

我正在使用 MinIO、Hive Metastore 和 Trino 在 Docker 上使用所有官方镜像的最新版本进行 PoC。我可以分享我的 /opt/hive/metastore-site.xml 和 /etc/trino/catalog/hive.proper...

回答 1 投票 0

hive 映射 mysql 表:在连接条件中选择不同的 mysql 数据源时无法成功

我使用jdbc存储处理程序将hive中的多个mysql数据源映射为https://cwiki.apache.org/confluence/display/Hive/JDBC+Storage+Handler; 第一个表是: 如果外部表不存在,则创建

回答 1 投票 0

失败:语义分析错误:在多个表/子查询中找到列

创建外部表old_events (天 STRING、foo STRING、计数 STRING、internal_id STRING) 分区依据(ds 字符串) 行格式分隔 以 ' ' 结尾的字段 位置“${输入}”; 创建 EX...

回答 2 投票 0

为什么使用“schematool -initSchema”无法识别hive-site.xml中的“amps”

配置完Hive和mysql后,希望通过Hive自带的schematool工具来升级元数据。当我输入升级说明时,显示以下错误。我也我们...

回答 1 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.