hiveql 相关问题

Apache Hive数据仓库基础结构中使用的SQL变体。将此标记用于与Hive查询语言相关的问题,包括HiveQL语法和HiveQL特定的函数。

将Hive查询中的百分位数功能转换为mysql

我正在将对字段(使用percentile(,0.25 ..)函数)进行第25、50和75%百分位计算的配置单元查询转换为mysql查询,并停留在percentile函数上。我尝试过...

回答 1 投票 0

编译语句时出错:失败:SemanticException [错误10002]-使用MAX ON HIVE进行选择

我正在尝试执行此选择以仅返回我正在使用HIVE的最新插入记录co_junta_comer和co_informacao可以重复,但是é需要最新记录select * from ...

回答 1 投票 0

计算往返上下班之间的时间

我想跟踪某人在往返火车上在每个火车站花费的时间。假设我的位置数据是通过不频繁的ping生成的,所以有人可以ping两次或五次...

回答 1 投票 0

分组变量的变化百分比

我有四个分组变量:月份,州,县,市。此外,我还有度量值列销售额,该列可以为空,我想计算每个城市每月销售额的变化百分比。 ...

回答 1 投票 0

配置单元插入覆盖所有分区

[假设,昨天我加载了partition_dates的数据:01-01、02-01至10-01。今天,当我加载数据时,我看到的partition_dates为:01-01、03-01至11-01,表示02-01。分区不可用。 ...

回答 1 投票 0

查询用户出现在表中的前48小时活动(HiveQL / SQL)

我正在使用一个Hive表,该表代表网站上的访问量,并包含诸如user_id,day和event之类的列。我也有一个单独的user_ids列表,我正在尝试为...

回答 1 投票 0

NTILE()如何处理不平衡的数据?

长话短说,我将一些数据分组为不同的段,并注意到在一列中的迁移使用NTILE(10)OVER(ORDER BY column_name DESC)分成了十进制。大约50%...

回答 1 投票 0

hive UDF-将StringObjectInspector转换为String

我正在编写通用UDF。如果我直接使用UDF,那么它可以工作,但是,如果我将UDF与其他函数(distinct,max,min)一起使用,它甚至不会调用评估函数。我想看看发生了什么,所以...

回答 1 投票 0

如何在where子句中添加冗余的真实条件以提高Hive查询性能?

让我举例说明。我们有一个包含100万条记录的表,其中有几列。注意where子句中的dt条件。创建表tbl作为select * from some_table where dt&...

回答 1 投票 0

将多个数组合并到映射中

我有一些数据(来自全表的样本),看起来像这样:| prov_id | hotel_id | m_id | apis_xml | company_id | yyyy_mm_dd | | --------- | ---------- | ------ | ---------- | ---------- -| ------------ | | ...

回答 1 投票 1

Athena:如何检查不同行的数组中重复元素的数量

我总体上不熟悉SQL或HIVE或Athena。我有下表col_id,col_list ABC,[abcde,123gd,12345,...] B3C,[bbbbb,ergdg,12345,...] YUT,[uyteh,bbbbb,...

回答 1 投票 0

通过获取同一分区中的上一个日期进行分区

我具有下表,其中包含我的sql查询结果的输出未提供我想要查看的输出(我在pyspark中执行此操作,因此是sive版本的sql):这是...

回答 1 投票 0

EMR主节点和从节点的自定义端口列表

我正在处理一个数据项目,我正在使用EMR集群进行数据处理。我的AWS环境受到限制,不允许我使用EMR管理安全组。为此,我需要自定义列表...

回答 1 投票 0

PySpark:根据其他列值与某些特定值匹配的条件选择一个列,然后将匹配结果创建为新列

我之前问过相似性问题,但是由于某些原因,很遗憾我不得不在PySpark中重新实现它。例如,app col1 app1有人爱我吗? app2我讨厌u app3这个...

回答 1 投票 0

捕获连续的年份范围,但出现蜂巢中断

我试图在配置单元中编写查询,以返回连续年份和间隔年份(如果年份之间存在间隔)的年份范围的数据。我想让我的头...

回答 2 投票 2

Hive查询:根据其他列值与某些特定值匹配的条件选择一个列,然后将匹配结果创建为新列

我必须在HiveQL中进行一些查询和创建列操作。例如,app col1 app1有人爱我吗? app2我讨厌你app3这顶帽子很好app4我不喜欢这个app5 ...

回答 2 投票 2

逻辑运算符不在括号内,返回令人困惑的结果

我有以下WHERE子句:NOT(除法='Freemium'AND team = 999并且触摸IS NULL)我希望这与以下内容相同:no WHERE子句减(除法(除法='Freemium'AND team = 999 AND)。 ..

回答 1 投票 1

如何使用Hive解析多个嵌套的JSON数组

{“ base”:{“ code”:“ xm”,“ name”:“ project”},“ list”:[{“ ACode”:“ cp1”,“ AName”:“ Product1”,“ BList” :[{“ BCode”:“ gn1”,“ ...

回答 1 投票 0

为什么Hive SQL在Select语句中的特定列都具有所有双精度值的情况下返回该列的NULL值?

我正在使用Hive SQL。版本是Hive 1.1.0-cdh5.14.0。在下面的示例中,sp.close是具有双精度值类型的列。我检查了sp.column,绝对没有NULL值。然而,在此...

回答 1 投票 0

无序列保证的条件LEAD / LAG

如果没有保证前面或后面的提前/滞后满足某个条件,该如何写有条件的提前/滞后?就我而言,我正在查看网站流量。样本数据(...

回答 2 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.