hiveql 相关问题

Apache Hive数据仓库基础结构中使用的SQL变体。将此标记用于与Hive查询语言相关的问题,包括HiveQL语法和HiveQL特定的函数。

在回溯期内存储最大交易量并保持第二高的交易量

我有以下查询(HiveQL),它从进行交易之日起计算客户的最大交易金额,并保留先前的先前最大交易金额...

回答 1 投票 0

如何在Hive中对整行进行md5?

[使用Hive,我希望对查询中的整个行进行哈希处理。我尝试了以下操作(不要介意$ {xxx},查询是从bash脚本构建的):从$ {DATABASE_NAME_SUFFIXE}中选择md5(*)。$ {...

回答 1 投票 0

HIVEX SQL中的REGEXP_SUBSTR等效项?

早上好。我正在Hive中寻找REGEXP_SUBSTR中的等效项,我在其他数据库(如Teradata)中使用了该等效项。我的具体情况是:我有一个包含字符串的字段。看起来像...

回答 1 投票 1

如何对特定的SQL列进行分组并检索那些列的计数最高的行?

我有以下数据:col_1 | col_2 | col_3 | col_4 ----------------------------- a1 b1 c1 d1 a1 b2 c1 d1 a1 b3 c1 d1 a1 b4 c1 d2 a1 ...

回答 2 投票 -1

配置单元:如何将yyyy-mm-ddThh:mm:SS:sssZZ转换为小时单位

我有以下时间戳记:2020-03-09T07:34:06:825Z 2020-03-09T07:54:12:220Z 2020-03-09T03:54:11:041Z 2020-03-09T09:22:10 :220Z 2020-03-09T11:13:36:217Z 2020-03-09T11:23:26:040Z 2020-03-09T11:43:...

回答 2 投票 2

如何将前两个配置单元表中的数据加载到下面的第三个配置表中?

下面是我面临的问题的简化版本,假设我在Hive中有一个员工和一个部门表。我的目标是将这两个表中的数据加载到下面的第三个表中。但是,...

回答 1 投票 0

Hive:在Hive sql中进行转置的方法

我正在尝试在Hive中转置以下结构的数据集:Id1 Id2事件1 1 7 2 2 3 2 2 7 3 3 8 8 3 3 1 2 3 1 2 7一些id组合具有...

回答 1 投票 0

试图通过侧面观察并爆炸将数组中的值包含在蜂巢中并导致多行爆炸

我有一个包含两列的表,我正在尝试使用数组中的值获取多行。我的表就是这样。日期用户2019-01-01 [“ U00001”,“ U00002”,“ U00002”]我是...

回答 1 投票 0

Hive中的截断日期值

我对Hive表中的列具有以下值(格式):2019-04-22 08:25:43.243754000000(yyyy-MM-dd HH:mm:ss.SSSSSSSSSSSS)有没有办法截断该值如下 ? :2019-04-22 ...

回答 1 投票 1

将max + 1插入同一表无法正常工作

我有一个方案...我有一个名为sample的表,该表包含三列:id,name,address,其中id是唯一的自动增量列。这是我的数据:id名称地址1 john LA 2 peter ....

回答 1 投票 0


用于从列创建分类的情况下的替代情况

我有一个表,其中列(COL1)的值可以为0到1(包括0)。我想从此列中创建一个新列,该列使用预定义范围对COL1进行分类(即创建箱)。 ...

回答 1 投票 0

如何在配置单元终端中查看活动数据库?

是否有任何方法可以查看我们在hive终端中使用哪个数据库。当使用webGUI(hue)在蜂巢中工作时,有一个数据库列表,我们可以从中选择数据库(将......>

回答 1 投票 0

在vs'>和

我使用从按日期划分的大型配置单元表中选择数据(格式:yyyyMMdd),配置单元查询需要从6个月的数据中获取几个字段(总共180个日期分区。...

回答 2 投票 1

我想为一列的运行值添加总和,但是如果序列失败,那么我们就不必添加

我有这样的桌子+ ---- + -------- + ------ + ------ + | id |州| num |流行+ ---- + -------- + ------ + ------ + | 1 | ny | 1 | 100 | | 1 | ny | 2 | 200 | | 1 | ny | 3 | ...

回答 1 投票 0

Hive查询:如何使用按排名分组?

我有一个像下面这样的表int int month ...

回答 1 投票 1

Hive查询无法识别表达式指定中'select''max''('附近的输入

我的蜂巢中有一个具有以下结构蜂巢的表>描述stock_summary; OK ...

回答 2 投票 0

hive-如何每天自动将数据追加到hive表中?

我在HDFS中有一个目录,其中固定结构和列名的.csv文件将在每天结束时转储,可能看起来像这样:我有一个配置单元表,应该具有新数据...

回答 2 投票 1

Hive:使用平均函数和大多数频率函数分组

我具有这样的表结构| --------------------- | ---------- | ------- ---- | | col_1 | col_2 | col_3 | | --------------------- | ---------- | ----------- | | 2018-01-15 17:56 | ...

回答 1 投票 1

将HDFS中的Jar文件添加到Hive中

[当我执行以下代码时:添加JAR hdfs:///user/hive/warehouse/hive-serdes-1.0-SNAPSHOT.jar;在Hive中,我得到以下错误:处理语句时出错:无法读取外部资源...

回答 1 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.