Apache Hive数据仓库基础结构中使用的SQL变体。将此标记用于与Hive查询语言相关的问题,包括HiveQL语法和HiveQL特定的函数。
我有一个示例数据集,如下所示。Id Name ReferredBy 1 John Doe NULL 2 Jane Smith NULL 3 Anne Jenkins 2 4 Eric Branford NULL 5 Pat Richards... ...
我有一个外部表,例如dump_table,它是按年、月、日分区的。如果我运行show create table dump_table,我得到以下结果。CREATE EXTERNAL TABLE `dump_table` ( `... )
我在一个表中有一列,它的类型是数组。 . 自2018-01-01起,每天对表进行分区。在某个阶段,数组中的值从字符串变成了整数。数据看起来像....
我是一个新的hive用户,我在我的一个种子子句中有一个列,我想用这些时间戳来检查从午夜到种子时间戳的数据。例如:seed.timestamp = '28042020 12:30:54',从这个时间戳中我想创建一个新的时间戳,这样......
FAILED.NullPointerException在HIVE QUERY中为null。HIVE QUERY中的NullPointerException为空。
以下是我正在使用的HIVE查询,我还使用了一个Ranking函数。我在我的本地机器上运行这个查询。SELECT numeric_id, location, Rank(location), followers_count FROM ( SELECT ...
大数据(spark sql和spark dataframes连接)
我是大数据平台的新手。请你让我知道不同的方式。1)我们如何连接到Spark sql的火花?2)我们如何连接到spark数据框或数据集的sparrk? 对于hive,我们...
我自6个月前开始使用hdp 2.4,并根据要求安装了3.0.1,但我不能访问它的旧命令,即不能加载spark-shell hive或Hadoop分布式...。
试图使用regexp_replace掩盖hive中的前6个字符。但是,无法实现解决方案。输入:123-45-6789 输出:##-##-6789 ###-##-6789
我可以在presto中计算vincenty距离,但是对于我的一个案例,我想计算蜂巢中的vincenty距离。我搜索了一下,但我无法找到任何东西。有什么方法可以...
学习Mapreduce:到底是reducer做数,还是mapper做数?
在一个mapreduce作业中,包括select count(*) from products where id = 2,count(*)操作发生在哪里,是在mapper还是reducer?
在Hive中,试图围绕下面的标准检查建立一个逻辑,但无法得出解决方案。标准是如果字符串的第一个位置以9开头,并且在第4个位置上有7或8,那么就只显示最后4位数字,否则返回所有9位数字。
我有一个服务器日志,它连续记录json值而没有任何定界符,例如:{“ a”:1} {“ b”,2} {“ a”:2} {“ c”:{\“ qwe \“:\” asd \“},” d“:” ert“} {” e“:12}...。我要提取每个元素并放入...
是否可以执行类似IF(numRows A> numRows B)的操作,然后将A写入C,其中A,B,C是具有相同模式的表?我正在使用HiveQL。
是否有一种方法可以获取单个配置单元查询以进行if-else类型的设置。在下面的我的数据中,我想确保如果Model为空或具有'-',请在“ Final”列中填充Device else ...
我有一个像这样的配置单元表(总共460列)colA colB ....... ce_id文件名......... dt vj 4 gg 40 vj 5 gg ...
有没有办法在Hive sql中使用OUTER UNION CORR?
我正在尝试通过使用UNION逻辑从四个表创建表,但是所有表的一列都不同。 PROC SQL;创建表output_table从tb1中选择cl1,cl2,cl3 OUTER UNION ...
我正在使用Hive。我想将表A和表B连接起来以获得表C。表A key1 key2名称1 alex 2 a alejandro 4 b xander表B key1 key2问候1 ...
我正在配置单元中进行除法运算,似乎自动将值取整。有没有办法我可以避免这种情况。示例选择cast(600 / 27701.47作为十进制(31,20)); + --------------...