hiveql 相关问题

Apache Hive数据仓库基础结构中使用的SQL变体。将此标记用于与Hive查询语言相关的问题,包括HiveQL语法和HiveQL特定的函数。

Hive Sql查询从Json数组中获取Json对象。

我在 "content "列里有一个json,格式如下。{ "identifier": [ { "type": { "type": { "coding": [ { "coding": { "code": "MRN", }...

回答 1 投票 1

Hive ALTER命令删除数值超过24个月的分区。

我有一个hive表(consumer_data),表中的分区列'val_dt'是一个字符串列,其值的日期格式为'yyyy-MM'。我在表中有多个分区,从'2015-01'到'...'。

回答 1 投票 0

在hive中从横向视图转换为案例陈述。

我需要把下面的代码在案例语句:select count (*) from db.tab1 lateral view explode(secondary.tertiary) exp as lv where id IN ('6','1') and array_contains (lv.ci, "1"); 我已经试过: ....

回答 1 投票 0

蜂巢中的减速器数量和计数(不同)。

有人告诉我,count(distinct )可能会导致数据偏斜,因为只用了一个reducer。我使用一个有50亿数据的表做了一个测试,有两个查询,查询A:select count(distinct columnA)......。

回答 1 投票 0

UserName

我有一个名为 "Login "的Hive表。它包含以下列:- 用户ID

回答 3 投票 -4

秘密ZULU时间改为PST

我试图将yulu格式的start_time隐藏到pst中。开始时间样本: 2020-02-04T04:36:42:211Z from_unixtime(unix_timestamp(sub string(start_time,1,17),'yyy-MM-ddThh:mm:ss.SSSZ),'yyy-...'。

回答 1 投票 0

使用窗口Hive或spark scala进行数据排列。

我要整理数据。Ip: 需要用蜂巢或数据框架输出。ID P ID

回答 1 投票 0

value_array 1

在hive中,我希望将一个数组从最大到最小排序,并得到索引数组。例如,这个表是这样的: id

回答 2 投票 1

如何在hive中取时间戳('yyy-mm-dd hh:mm:ss')的平均值?

我有一个日志表。看起来是这样的: - user_name idle_hours working_hours start_time stop_time [email protected] 2019-10-24 05:05:00 2019-10-24 05:50:00 ...。

回答 2 投票 0

SELECT查询蜂巢

我是Hive的新手,我想只选择以 "id "结尾的列,例如,movieid,userid等。我已经试过了。SELECT '*+(id)' FROM ratings WHERE movieid = 1; 但没有成功。...

回答 1 投票 2

['101', '102', '103'] 2

我有两张表,如下所示: table1:id sid 1。

回答 1 投票 0

火花INLINE与LATERAL VIEW EXPLODE的区别?LATERAL VIEW EXPLODE的区别?

在Spark中,对于下面的用例,我想了解使用INLINE和EXPLODE的主要区别是什么 ... 我不知道是否会对性能产生影响,或者是否一 ...

回答 1 投票 0

使用多个WHEREs高效地连接两个表。

我遇到一个问题,当我尝试用WHERE...OR子句连接两个大表并选择条目时,我遇到了一个问题。SELECT A.a, B.b FROM A JOIN B ON A.equal = B.equal WHERE A.condition1 > 100 OR B.condition2 > ...

回答 1 投票 0

如何在源码中看到另一列是否有特定的值,然后将其设置为单一值,从而填充一列。

我有一个疑问,我有一个表,在一个特定的独特的sk列,我有两个不同的指标(Y,N),所以对于一个特定的sk,如果我有一个 "Y",然后设置每个值为Y,如果值都... ...

回答 1 投票 0

array1 1

我有两个表,table1:id

回答 1 投票 1

hive中Avro文件格式与bz2压缩的区别

我知道下面是蜂巢的输入和输出格式,文本文件。序列文件。RC文件。AVRO文件。ORC文件。Parquet文件。我们什么时候使用bz2压缩,它们与蜂巢有什么不同?

回答 1 投票 0

在Hive的row_number()中通过窗口函数的顺序对分区进行自定义排序。

我有一个表,表中有一个标识符列id和另一列字符串值column_b,我想对column_b进行客户订购。假设column_b由值A、B、......组成。

回答 1 投票 0

HIVE SQL: 选择值包含在一列中的字符串的行。

我想选择在一列中的值包含一个字符串的行。例如,我想选择所有的行,其值包含一个字符串'123'在列'应用程序'.表:应用程序ID 123helper ...

回答 3 投票 1

Hive分区表查询优化

我是Hive的新手,也是Hadoop生态系统的新手,从我所了解到的Hive的基础知识来看,你可以根据某些属性在Hive表上创建分区,如果一个查询中有任何提到该属性的......

回答 1 投票 0

如何在Hive上将Julian日期转换为日历日期?

是否有任何Hive功能可以将Julian日期转换为日历日期?儒略日期有多种类型。我的Julian日期是2015-01-01的15001。我找不到任何 ...

回答 3 投票 1

© www.soinside.com 2019 - 2024. All rights reserved.