hive 相关问题

Hive是Hadoop的数据仓库系统,可以简化数据汇总,即席查询以及分析存储在Hadoop兼容的分布式文件系统中的大型数据集。 Hive提供了一种机制,用于将结构投影到此数据上,并使用类似SQL的语言HiveQL查询数据。

将最后一个非空值填充到下一个空行,直到 Hive 中下一个可用的非空值

我的输入数据如下,新的 MD_flag 是基于 md_flag 列 vaue 的输出列。 销售季节|商品|地点|每周|md_flag|新md_flag Q1-23|BP608WZ271812|LBDI|3 月 W5-23|正确|正确 ...

回答 1 投票 0

从 Hive 中的数组<String>中提取最大值

有没有办法从 Hive 中的字符串数组中提取最大值? 我需要在 select 语句中执行此操作,因此不能选择爆炸和连接。 ch = ["4", "9", "1"];

回答 1 投票 0

如何清除Hive并重新初始化它

在我的应用程序中,我使用 Hive 来处理多个对象,并为它们使用多个盒子。 我想知道有没有办法一次性清除所有这些,然后重新初始化蜂巢? 我需要这个来注销我的应用程序...

回答 1 投票 0

如何在 org.apache.hive.jdbc.HiveDriver pyspark databricks 中设置属性

我正在使用 org.apache.hive.jdbc.HiveDriver 从配置单元读取数据,我试图传递此属性: hive.resultset.use.unique.column.names = false 在配置字典中: jdbc_url = f"jdbc:hiv...

回答 1 投票 0

获取字符串中相同输入旁边的最大值

我正在开发 Hive: 我有以下字符串: D.07.01.01=1;B=NUL;A=NUL;D.07.01.01=NUL;R=1;D.07.01.01=2;D.07.01.08=2;D.07.01.07= 1;D.07.01.06=2;D.07.01.05=1;D.07.01.04=2;D.07.01.03=1;F=是;D.07....

回答 1 投票 0

如何在hive中添加jar文件

我尝试使用ADD JAR hive-contrib-0.10.0.jar命令在hive中添加hive-contrib-0.10.0.jar,但它总是说hive-contrib-0.10.0.jar不存在。 我现在使用的是 HDP 2.1 版本。我...

回答 5 投票 0

Hive sql 分区

我有一列用于 row_number() over (partition...) row_number() OVER (分区 BY customer_id ORDER BY order_date, order_number) AS order_row, 和另一列计算“累积...

回答 1 投票 0

使用 SparkSQL 时 PARTITION BY 的“RANGE BETWEEN”问题

当我尝试在sparkSQL中使用PARTITION BY时,我遇到了这个复杂的查询: 对于当前的每一行,使用 user_id,product_id,[create_date-3day,create_date+3day] 作为数据窗口,做一些数据查询...

回答 2 投票 0

`spark.sql.sources.schema`表属性是什么意思?

我最近在 ETL 代码中遇到了一个错误,我已经确定了它的根本原因,我知道它与名为 Spark.sql.sources.schema 的属性有关,但我想了解更多信息.. .

回答 1 投票 0

如何在 Hive 或 Presto 中将以下字典格式列转换为不同格式?

我有一个 Hive 表,如下所示: 事件名称 每个国家的与会者人数 A {'美国':5} 乙 {“美国”:4,“英国”:3,“加拿大”:2} C {'英国':2,'加拿大':1} 我想得到一个如下所示的新表: 国家 人数...

回答 2 投票 0

Flutter andriod中如何或在哪里存储FCM后台通知数据到Hive中?

我正在开发一个需要在后台运行时存储通知的应用程序。我尝试使用放入存储模块来保存通知,但当应用程序处于

回答 1 投票 0

hive 在分区表上添加列不起作用

我分享在分区 Hive 表上添加列的经验。 正如您所看到的,尽管有 CASCADE 功能,但 ALTER 会破坏我的表:( 在分区表上添加列 表格描述...

回答 2 投票 0

SQL 查询将具有多个状态更改日期列的单行转换为具有状态和时间戳的多行

我的输入数据如下: 故事ID || sched_state ||故事_being_groomed_ts || Story_def_ts || Story_in_prgrs_ts ||故事_cmpl_ts || =================================================== =====...

回答 1 投票 0

无法运行配置单元

尝试运行配置单元但当前收到此错误。错误尝试将此行 hive-site.xml 添加到我的 hive-site.xml 但我仍然得到相同的“HiveConf 名称 hive.server2.enable.imperson...

回答 1 投票 0

从远程 Spark 连接到 Hive 元存储

我有安装了 hive 和 Spark 的 hadoop 集群。此外,我有一台单独的工作站计算机,我正在尝试从它连接到集群 我在这台机器上安装了 Spark 并...

回答 1 投票 0

为 HIVE 中现有的物理列创建分区

是否可以创建一个分区列作为HIVE中表列之一的表? 例如:创建表 test (a int, b string, c int),由 (c int) 分区 当运行上面的代码时,它会......

回答 1 投票 0

Flutter Hive 无法正常工作,我正在使用 Hive 在设备上存储数据,但是当我关闭并重新启动应用程序时,我会丢失所有内容

我正在开发一个flutter应用程序,首先我要说的是我是一个初学者,我正处于移动开发的开始阶段,我使用Hive在设备上存储数据,同时进行调试我看到了...

回答 1 投票 0

Flutter Hive 向后兼容性

我正在使用 hive 进行本地缓存。 在应用程序中,我有一个名为 user 的 Hive 对象。 UserModel 类扩展 HiveObject 实现 Copyable { 用户模型({ 需要 this.id,

回答 1 投票 0

通过 HDFS/Haddop 解压 bz2 文件的内容

如何在 HDFS 中解压 bz2 文件 系统想要将此.csv 文件上传到我在 hive 中创建的表中 2003.csv.bz2 我有这个文件 zcat 2003.csv.bz2 | hdfs dfs -put - /user/$USER/workspace 这我

回答 1 投票 0

在配置单元中查找最大日期

我有一个名为“日期”的列,它是字符串数据类型。 2018年1月24日 2017年4月30日 如何找到字符串中这些日期的最大值? 我使用了这个查询,它没有返回预期的 m...

回答 1 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.