Apache Hive数据仓库基础结构中使用的SQL变体。将此标记用于与Hive查询语言相关的问题,包括HiveQL语法和HiveQL特定的函数。
我有以下查询(HiveQL),它从进行交易之日起计算客户的最大交易金额,并保留先前的先前最大交易金额...
[使用Hive,我希望对查询中的整个行进行哈希处理。我尝试了以下操作(不要介意$ {xxx},查询是从bash脚本构建的):从$ {DATABASE_NAME_SUFFIXE}中选择md5(*)。$ {...
早上好。我正在Hive中寻找REGEXP_SUBSTR中的等效项,我在其他数据库(如Teradata)中使用了该等效项。我的具体情况是:我有一个包含字符串的字段。看起来像...
我有以下数据:col_1 | col_2 | col_3 | col_4 ----------------------------- a1 b1 c1 d1 a1 b2 c1 d1 a1 b3 c1 d1 a1 b4 c1 d2 a1 ...
配置单元:如何将yyyy-mm-ddThh:mm:SS:sssZZ转换为小时单位
我有以下时间戳记:2020-03-09T07:34:06:825Z 2020-03-09T07:54:12:220Z 2020-03-09T03:54:11:041Z 2020-03-09T09:22:10 :220Z 2020-03-09T11:13:36:217Z 2020-03-09T11:23:26:040Z 2020-03-09T11:43:...
下面是我面临的问题的简化版本,假设我在Hive中有一个员工和一个部门表。我的目标是将这两个表中的数据加载到下面的第三个表中。但是,...
我正在尝试在Hive中转置以下结构的数据集:Id1 Id2事件1 1 7 2 2 3 2 2 7 3 3 8 8 3 3 1 2 3 1 2 7一些id组合具有...
试图通过侧面观察并爆炸将数组中的值包含在蜂巢中并导致多行爆炸
我有一个包含两列的表,我正在尝试使用数组中的值获取多行。我的表就是这样。日期用户2019-01-01 [“ U00001”,“ U00002”,“ U00002”]我是...
我对Hive表中的列具有以下值(格式):2019-04-22 08:25:43.243754000000(yyyy-MM-dd HH:mm:ss.SSSSSSSSSSSS)有没有办法截断该值如下 ? :2019-04-22 ...
我有一个方案...我有一个名为sample的表,该表包含三列:id,name,address,其中id是唯一的自动增量列。这是我的数据:id名称地址1 john LA 2 peter ....
我有一个表,其中列(COL1)的值可以为0到1(包括0)。我想从此列中创建一个新列,该列使用预定义范围对COL1进行分类(即创建箱)。 ...
是否有任何方法可以查看我们在hive终端中使用哪个数据库。当使用webGUI(hue)在蜂巢中工作时,有一个数据库列表,我们可以从中选择数据库(将......>
我使用从按日期划分的大型配置单元表中选择数据(格式:yyyyMMdd),配置单元查询需要从6个月的数据中获取几个字段(总共180个日期分区。...
我想为一列的运行值添加总和,但是如果序列失败,那么我们就不必添加
我有这样的桌子+ ---- + -------- + ------ + ------ + | id |州| num |流行+ ---- + -------- + ------ + ------ + | 1 | ny | 1 | 100 | | 1 | ny | 2 | 200 | | 1 | ny | 3 | ...
Hive查询无法识别表达式指定中'select''max''('附近的输入
我的蜂巢中有一个具有以下结构蜂巢的表>描述stock_summary; OK ...
我在HDFS中有一个目录,其中固定结构和列名的.csv文件将在每天结束时转储,可能看起来像这样:我有一个配置单元表,应该具有新数据...
我具有这样的表结构| --------------------- | ---------- | ------- ---- | | col_1 | col_2 | col_3 | | --------------------- | ---------- | ----------- | | 2018-01-15 17:56 | ...
[当我执行以下代码时:添加JAR hdfs:///user/hive/warehouse/hive-serdes-1.0-SNAPSHOT.jar;在Hive中,我得到以下错误:处理语句时出错:无法读取外部资源...