hiveql 相关问题

Apache Hive数据仓库基础结构中使用的SQL变体。将此标记用于与Hive查询语言相关的问题,包括HiveQL语法和HiveQL特定的函数。

按日期Hive计算单个组每月的交易数量

我有一张客户交易表,客户购买的每件物品都存储为一行。因此,对于单个事务,表中可以有多行。我还有一个叫...

回答 1 投票 0

Hive联接查询优化

表A --------- col1,col2,Adate,qty表B ------- col2,cost,Bdate表的大小如下:A:100万B:700k考虑此查询:SELECT A.col1,A.col2,B.Bdate bdate,SUM(...

回答 2 投票 1

具有拼花地板数据格式重新排列列的蜂房表

我们使用的是配置单元1.1.0,要求重新排序具有100列的巨大表之一的列,以提高用户的可读性。但是,当我们对表中的列进行重新排序时,其失败并显示以下错误。 ...

回答 2 投票 1

如何使用sqoop将数据导出到具有自动增量ID的Microsoft Sql表?

我在Microsoft Sql上有一张表,其中字段ID设置为自动递增。我想将数据从hadoop导出到此sql表。我创建了一个hiveql表来镜像sql表,并尝试设置null ...

回答 1 投票 0

从HiveQL的url字段中解析和提取字段

我从表中获得此数据:id,uri,date_entered,p_id,ads_id 1,http://vegiefood.com/path1/p.php?keyword = veganway&country = france#Ref1,30 / JUN / 2016,PVEGIEFOOD ,GOOGLEADSENSE 2,http:// ...

回答 1 投票 0

如何从Hive映射中获取唯一键列表

我在Hive的一列中存储了一个映射,其中每行的键可以不同。如何从每个地图中获取仅键的列表?

回答 1 投票 0

使用Case Hive查询查找ID是否匹配并替换

我有一个名为“ Scan”客户交易的表,其中对每个不同的交易,一个personal_id都会出现一次,并且包含诸如scan_id之类的列。我还有另一个称为id的表,其中包含...

回答 1 投票 0

将日期分割为Hive或SQL Server中的多个日期范围

我想将以下日期转换为不同的日期范围,此处emp属于2019年5月25日至2099-02-14年之间的钦奈地区,但介于emp之间,emp在2020-02-15年至2020年之间由DEL工作-...

回答 2 投票 0

提高配置单元托管表中插入覆盖的性能

我是Hive的新手,我想知道表属性的列表,以提高hive托管表中插入覆盖的性能。有人可以帮忙吗?

回答 1 投票 1

Hive查询以使用正则表达式提取字符串的一部分

需要使用regexp_extract进行Hive查询以提取字段(字符串类型)的一部分。其中的值是用冒号分隔的字段字符串:ID(1001):10 | Value(1002):8 | Name(xyz):7需要提取值...

回答 1 投票 1

配置单元:如何消除重复的子字符串

配置单元表:创建表T(i int,s字符串);插入T值(1,“ a1&b2”),(1,“ b2&c3”),(2,“ c1&d2”),(2,“ c1”); s列包含用&...

回答 1 投票 1

如何在spark sql case / when语句中为多个列分配值

我的病情严重。我从案例陈述中得出2个字段。我可以编写2个case语句(完全相同的逻辑)以分别导出每个字段值。我可以知道吗...

回答 1 投票 0

如何将jsonarray从配置单元转换为多列

示例:在配置单元表中有一个json数组列(类型:字符串),例如:“ [{” filed“:” name“,” value“:” alice“},{” filed“:” age“, “ value”:“ 14”} ......]“”如何将其转换为:name age alice ...

回答 1 投票 0

为具有不同ID的记录插入行

我想为表格中存在的每个不同ID插入一行。为每个不同的ID添加这些行的最佳和有效方法是什么? ID名称计数----- ---...

回答 1 投票 0

我如何在Hive CLI中检查设置?

我想在hive命令中运行一个hive查询,我想使其更快,所以我运行了:hive:messages> set mapred.job.priority = VERY_HIGH; hive:messages> set hi = 1;但实际上我可以设置...

回答 1 投票 5

在日期/时间范围内的查询配置单元分区表

我的蜂巢表按年,月,日,小时进行分区现在我想从2014-05-27到2014-06-05提取数据?我知道一个选择是在纪元(或yyyy-mm-dd-hh)上创建分区,然后...

回答 3 投票 5

Hive Bucket的最大功能

我在HIVE中具有如下表结构-如果不存在则创建表cdp_compl_status(EmpNo INT,RoleCapability STRING,EmpPUCode STRING,SBUCode STRING,CertificationCode STRING,...

回答 1 投票 0

用于为一个ID为一个产品选择多个记录的SQL查询

我的表看起来像这样,我要实现的目的是为一个拥有最早日期产品| type_id |的产品的一个用户提取所有记录。用户|日期|希望以ROW_NUMBER作为...

回答 2 投票 0

如何在蜂巢或python中计算周数?该周应从星期六到星期五运行

我尝试了以下操作:选择weekofyear(current_timestamp)但这将计算从星期一到星期日的星期。我想要从星期六到星期五的一周,因为它应该填充一周...

回答 2 投票 1

如何在蜂巢或python中计算星期数。星期应从星期六到星期五开始

我尝试了以下操作:选择weekofyear(current_timestamp),但这将计算从星期一到星期日的星期。我希望从周六到周五的一周,因为它应该填充周数。 ...

回答 2 投票 1

© www.soinside.com 2019 - 2024. All rights reserved.