hiveql 相关问题

Apache Hive数据仓库基础结构中使用的SQL变体。将此标记用于与Hive查询语言相关的问题,包括HiveQL语法和HiveQL特定的函数。

从配置单元中的先前分区获取数据

我想生成一个报告,比较今天分区的数据和7天前的数据。表已分区在数据分区上。我可以执行data_date-7并获取该分区。但是假设我不...

回答 1 投票 0

Hive ORC表空字符串

我有一个Hive表,其中的数据存储为ORC。我在某些字段中写了空值(空白,““”),但是有时当我在此表上运行选择查询时,空字符串列在...

回答 1 投票 0

如何从各个学科中选拔前20%的学生

[每门学科的前20%的学生排名(根据获得的分数而定)对于每门学科,找出这些前20%的学生所获得的平均分数。以下是样本数据:这必须是...

回答 1 投票 -2

如何从在日期列上划分的配置单元表中获取最新日期?

例如如果我的日期列是load_date,则使用max(load_date)运算符将扫描配置单元中的每个数据文件,从而使其成为昂贵的操作。相反,有什么最佳方法可以从...

回答 1 投票 0

在Spark SQL中由vs进行分发

我最近开始研究spark,在加入之前,我们总是使用cluster by来优化表,但是我想知道在哪种情况下,我们更喜欢使用by by cluster by子句进行分配...。

回答 1 投票 0

单个查询中的多个聚合和分组依据

我有一个具有以下大致结构的SQL表:Employee |日期|部门|国家(地区)|指定我想要的结果是采用以下结构:...

回答 1 投票 0

如何通过Hive中的数组总和归一化数组?

我有一个像这样的配置单元:id | value_array 1 | [1、2、3、4] 2 | [1、2、1、1]我希望通过数组的总和来对value_array进行归一化,以便获得以下结果:id | ...

回答 1 投票 0

从Hive中的现有表创建新表

我正在尝试使用Hive查询使用现有表创建一个新表。在创建新表时,我想添加新列并为所有行插入当前时间戳。例如:正在退出...

回答 2 投票 0

将数据库所有者设置为角色不允许用户创建表

在Apache Hive中,我将数据库的所有者设置为一个角色。已为用户分配了此角色。用户无法在该数据库中创建表。错误是:主体(名称= xx,类型= USER)不...

回答 1 投票 0

使用QL插入蜂箱未运行

我想在配置单元表中插入简单查询;我使用下面的代码创建表t(id int,f1 String,f2 int);并尝试将insert插入t值(1,'123',1);创建一个任务,...

回答 1 投票 0

如果在延迟中使用的列具有相同的值,则在使用延迟功能时分配相同的值

我在sql中有一张表,内容在+ --- + ---------- + ---------- + ---------- +- ------- + | pk | from_d | to_d | load_date | row_num | + --- + ---------- + ---------- + ---------- + -------- + | 111 | 2019-03 -...

回答 1 投票 1

列值取0或nul代替HIVE中的char数据类型

我有一个表,其中的列之一具有char(3)数据类型。表创建语句工作正常。但是,当尝试使用char(3)数据插入该表时。该代码工作正常。 ...

回答 1 投票 0

在配置单元中查找每个ID的平均小时数

我的数据集看起来像这样:-id working_hour 1005 2019-10-23 08:35:00 1006 2019-10-23 00:54:59 1007 2019-10-23 00:24:57 1008 2019- 10-23 06:40:00 1009 2019-10-23 03:50:00 ...

回答 2 投票 0

配置单元在导出csv时抛出ParseException

hive -e'SELECT *,MIN(高)OVER(按时间顺序按符号顺序排列)为MIN_YEARLY,MAX(HIGH)OVER(按时间按符号顺序按SYMBOL顺序排列)为MAX_YEARLY,AVG(HIGH)过量(按符号分隔) ORDER ...

回答 1 投票 0

ConvertJsonToSQL用于Hive插入查询

我想将Json插入配置单元数据库。我尝试使用ConvertJsonToSQL Ni-Fi处理器将Json转换为SQL。如何在查询中使用PARTITION(....)部分?我可以这样做还是应该使用...

回答 1 投票 0

选择代表一个组的MAX(DATE)的字符串列? [Hive]

我有一个产品表产品编号|类型代码日期P1-A D D1 2020-03-18 P1-A D D2 2020-03-20 P1-A D ...

回答 1 投票 1

解析异常-org.apache.spark.sql.catalyst.parser.ParseException:

我正在运行以下sql,但出现错误,“期望输入'r'不匹配(第1行,位置17)” scala> hiveContext.sql(“当r.code为'0000'时选择大小写,然后为'ABC'否则'XYZ'从测试结束。...

回答 1 投票 0

Hadoop路径不能为空

我有一个外部表。在尝试删除它时,我遇到以下错误Metaexception(message:java.lang.illegalArgumentException:hadoop path不能为null)(state = 08s01,code = 1)我尝试过...

回答 1 投票 0

如何在不将新值写入表的情况下向现有列添加新值?

我具有下表1:| yyyy_mm_dd | id |功能|状态| | ------------ |||| ----------------- | ------------- -| | 2019-05-13 | 2 |定价|已实施| | 2019-05-13 ...

回答 2 投票 1

增加HiveWarehouseSession中的容器大小和应用程序主内存

我们能否通过Spark中的HiveWarehouseSession增加tez容器的大小和应用程序主内存。属性:-tez.am.resource.memory.mb hive.tez.container.size

回答 1 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.