Hive是Hadoop的数据仓库系统,可以简化数据汇总,即席查询以及分析存储在Hadoop兼容的分布式文件系统中的大型数据集。 Hive提供了一种机制,用于将结构投影到此数据上,并使用类似SQL的语言HiveQL查询数据。
当CTE中的窗口函数row_number在hive中生成结果时
我在 hive CTE 中使用 row_number 窗口函数(with 子句) 与数据( 选择 1a,1b 联合选择 1,2 联合选择 1,3 联合选择 1,4 ... 联合选择 1,26 ), data_with_row_num ( 选择a、b、
需要通过Flink(FlinkSQL)一次查询从Kafka和Hive读取数据
我想在 Flink 中运行异构查询,在一个查询中从 Kafka 读取多个表(数据写入 Kafka,以便您可以通过 FlinkSQL 连接它们),并从 Hive 读取多个表。 我...
获取当年尝试过考试且在过去 12 个月内至少尝试过一次的学生
我有一项任务,要找到当月(2023 年 11 月)参加过考试并且在过去 12 个月内至少参加过一次考试的普通学生。所以回顾期是...
好时光。 我想使用 Hive 保存文本字段的值,以便在打开和关闭应用程序时该值不会丢失。 但这并没有正确完成。 代码: 升高的按钮(
Impala JDBC 错误:用户“”没有权限在表上执行“SELECT”
最近我为Hive启用了Sentry策略文件。因此,当我尝试使用 Impala-JDBC4(版本 2.5.16)在 Impala 中执行查询时,出现以下错误: 错误消息:AuthorizationException:用户''做...
我安装了 hiveserver2,其中设置了以下超时配置: hive.server2.session.check.interval=3600000 hive.server2.idle.operation.timeout=7200000 hive.server2.idle.session.timeout=
:org.apache.spark.sql.AnalysisException:在调用集合操作(相交、例外等)的DataFrame中不能有映射类型列,但列map_col的类型是map 我有一张蜂巢桌,...
在我的表中,有一列,其中每行包含 n 个值的列表,格式如下: [“5”,“12”,“13”]。这是一个字符串 有没有办法让我总结一下...
我有一个这样的查询: 选择 ID, 网址, count(*) 作为计数 从命中 在哪里 ... 通过...分组 ID, 网址 有一些独特的 ID,通常分配有多个 url,但只有其中之一......
我尝试通过 Java 应用程序连接到 Hive2,但收到以下错误 - 线程“main”中出现异常 java.sql.SQLException:[Simba][HiveJDBCDriver](500310) 无效操作:
Flinksql 创建 Hive 目录导致“配置的默认数据库默认值在目录 myhive 中不存在。”
我已按照说明安装相关库和 hive 依赖项。但是,当我创建目录时它仍然无法工作。看来这个项目还不稳定。我也尝试过 jdbc c...
我正在使用 Dataroc Metastore、Dataproc Batch 和 Pyspark。虽然我使用的是 GCP,但我相信这是常见的 Apache Iceberg 问题。 我运行我的 Spark 作业并自动创建了冰山旅行表
追踪ID 00054123 00054214 从上表中,我想选择不带 000 前缀的跟踪 ID。目前我正在使用子字符串函数。有没有办法使用正则表达式函数来做到这一点?
我可以像在 hive 中那样更改所选数据库的 mysql 提示符吗?
在hive中我可以将提示设置为当前选择的数据库。在 MySQL 中是否可以做同样的事情? 我想将下图中的 mysql 替换为 kundoor。
如何将apache/hive镜像与apache/hadoop镜像连接?
我有 docker-compose.yml 文件。我如何将 apache hive 与 apache hadoop 连接起来?我想在配置单元上创建表。从 api 中提取数据并加载到 hadoop hdfs 中。还有另一种方法,比如创建 DockerFi...
输入如下: 2017-07-03 预期输出如下: 20170703 我尝试了下面的代码: 年(2017-07-03) * 10000 + 月(2017-07-03) * 100 + 日(2017-07-03)) 有没有内置功能...
在Hive查询(HQL)中创建两个日期之间的日期,稍后需要进一步转换
来源 所需输出 我想要的输出是 D 列和 C 列。 公式列可帮助您了解我如何进行计算。 我首先尝试根据最小日期和最大日期来分解日期。什...
Apache Hive 中的 DECIMAL 是固定长度类型吗?
在 Apache Hive 中如何获取 DECIMAL 的长度,如果它是固定长度类型,例如 16 字节或不是? 我没有在文档中找到信息,如果它有一些方法来获取长度,比如...
HiveAccessControlException 权限被拒绝:用户没有 [ALL] 权限
我对 hive 和 hadoop 生态系统非常陌生。 我正在尝试在配置单元中创建一个新表,但遇到此错误: 根据一些建议,我必须设置 Ranger 策略,但基于
PySpark:MutableLong 无法转换为 MutableInt(数据帧中没有 long)
我正在尝试使用 boto3 中的 Glue 客户端从 PySpark 中的 Athena 读取配置文件表,并检查它是否为空。为什么 Spark 在将 Int 转换为 Long 时出现错误,知道我没有 Long 类型......