Apache Hive数据仓库基础结构中使用的SQL变体。将此标记用于与Hive查询语言相关的问题,包括HiveQL语法和HiveQL特定的函数。
我在 "content "列里有一个json,格式如下。{ "identifier": [ { "type": { "type": { "coding": [ { "coding": { "code": "MRN", }...
我有一个hive表(consumer_data),表中的分区列'val_dt'是一个字符串列,其值的日期格式为'yyyy-MM'。我在表中有多个分区,从'2015-01'到'...'。
我需要把下面的代码在案例语句:select count (*) from db.tab1 lateral view explode(secondary.tertiary) exp as lv where id IN ('6','1') and array_contains (lv.ci, "1"); 我已经试过: ....
有人告诉我,count(distinct )可能会导致数据偏斜,因为只用了一个reducer。我使用一个有50亿数据的表做了一个测试,有两个查询,查询A:select count(distinct columnA)......。
我试图将yulu格式的start_time隐藏到pst中。开始时间样本: 2020-02-04T04:36:42:211Z from_unixtime(unix_timestamp(sub string(start_time,1,17),'yyy-MM-ddThh:mm:ss.SSSZ),'yyy-...'。
我要整理数据。Ip: 需要用蜂巢或数据框架输出。ID P ID
如何在hive中取时间戳('yyy-mm-dd hh:mm:ss')的平均值?
我有一个日志表。看起来是这样的: - user_name idle_hours working_hours start_time stop_time [email protected] 2019-10-24 05:05:00 2019-10-24 05:50:00 ...。
我是Hive的新手,我想只选择以 "id "结尾的列,例如,movieid,userid等。我已经试过了。SELECT '*+(id)' FROM ratings WHERE movieid = 1; 但没有成功。...
火花INLINE与LATERAL VIEW EXPLODE的区别?LATERAL VIEW EXPLODE的区别?
在Spark中,对于下面的用例,我想了解使用INLINE和EXPLODE的主要区别是什么 ... 我不知道是否会对性能产生影响,或者是否一 ...
我遇到一个问题,当我尝试用WHERE...OR子句连接两个大表并选择条目时,我遇到了一个问题。SELECT A.a, B.b FROM A JOIN B ON A.equal = B.equal WHERE A.condition1 > 100 OR B.condition2 > ...
如何在源码中看到另一列是否有特定的值,然后将其设置为单一值,从而填充一列。
我有一个疑问,我有一个表,在一个特定的独特的sk列,我有两个不同的指标(Y,N),所以对于一个特定的sk,如果我有一个 "Y",然后设置每个值为Y,如果值都... ...
我知道下面是蜂巢的输入和输出格式,文本文件。序列文件。RC文件。AVRO文件。ORC文件。Parquet文件。我们什么时候使用bz2压缩,它们与蜂巢有什么不同?
在Hive的row_number()中通过窗口函数的顺序对分区进行自定义排序。
我有一个表,表中有一个标识符列id和另一列字符串值column_b,我想对column_b进行客户订购。假设column_b由值A、B、......组成。
我想选择在一列中的值包含一个字符串的行。例如,我想选择所有的行,其值包含一个字符串'123'在列'应用程序'.表:应用程序ID 123helper ...
我是Hive的新手,也是Hadoop生态系统的新手,从我所了解到的Hive的基础知识来看,你可以根据某些属性在Hive表上创建分区,如果一个查询中有任何提到该属性的......
是否有任何Hive功能可以将Julian日期转换为日历日期?儒略日期有多种类型。我的Julian日期是2015-01-01的15001。我找不到任何 ...