Apache Hive数据仓库基础结构中使用的SQL变体。将此标记用于与Hive查询语言相关的问题,包括HiveQL语法和HiveQL特定的函数。
我想生成一个报告,比较今天分区的数据和7天前的数据。表已分区在数据分区上。我可以执行data_date-7并获取该分区。但是假设我不...
我有一个Hive表,其中的数据存储为ORC。我在某些字段中写了空值(空白,““”),但是有时当我在此表上运行选择查询时,空字符串列在...
[每门学科的前20%的学生排名(根据获得的分数而定)对于每门学科,找出这些前20%的学生所获得的平均分数。以下是样本数据:这必须是...
例如如果我的日期列是load_date,则使用max(load_date)运算符将扫描配置单元中的每个数据文件,从而使其成为昂贵的操作。相反,有什么最佳方法可以从...
我最近开始研究spark,在加入之前,我们总是使用cluster by来优化表,但是我想知道在哪种情况下,我们更喜欢使用by by cluster by子句进行分配...。
我有一个具有以下大致结构的SQL表:Employee |日期|部门|国家(地区)|指定我想要的结果是采用以下结构:...
我有一个像这样的配置单元:id | value_array 1 | [1、2、3、4] 2 | [1、2、1、1]我希望通过数组的总和来对value_array进行归一化,以便获得以下结果:id | ...
我正在尝试使用Hive查询使用现有表创建一个新表。在创建新表时,我想添加新列并为所有行插入当前时间戳。例如:正在退出...
在Apache Hive中,我将数据库的所有者设置为一个角色。已为用户分配了此角色。用户无法在该数据库中创建表。错误是:主体(名称= xx,类型= USER)不...
我想在配置单元表中插入简单查询;我使用下面的代码创建表t(id int,f1 String,f2 int);并尝试将insert插入t值(1,'123',1);创建一个任务,...
如果在延迟中使用的列具有相同的值,则在使用延迟功能时分配相同的值
我在sql中有一张表,内容在+ --- + ---------- + ---------- + ---------- +- ------- + | pk | from_d | to_d | load_date | row_num | + --- + ---------- + ---------- + ---------- + -------- + | 111 | 2019-03 -...
我有一个表,其中的列之一具有char(3)数据类型。表创建语句工作正常。但是,当尝试使用char(3)数据插入该表时。该代码工作正常。 ...
我的数据集看起来像这样:-id working_hour 1005 2019-10-23 08:35:00 1006 2019-10-23 00:54:59 1007 2019-10-23 00:24:57 1008 2019- 10-23 06:40:00 1009 2019-10-23 03:50:00 ...
hive -e'SELECT *,MIN(高)OVER(按时间顺序按符号顺序排列)为MIN_YEARLY,MAX(HIGH)OVER(按时间按符号顺序按SYMBOL顺序排列)为MAX_YEARLY,AVG(HIGH)过量(按符号分隔) ORDER ...
我想将Json插入配置单元数据库。我尝试使用ConvertJsonToSQL Ni-Fi处理器将Json转换为SQL。如何在查询中使用PARTITION(....)部分?我可以这样做还是应该使用...
选择代表一个组的MAX(DATE)的字符串列? [Hive]
我有一个产品表产品编号|类型代码日期P1-A D D1 2020-03-18 P1-A D D2 2020-03-20 P1-A D ...
解析异常-org.apache.spark.sql.catalyst.parser.ParseException:
我正在运行以下sql,但出现错误,“期望输入'r'不匹配(第1行,位置17)” scala> hiveContext.sql(“当r.code为'0000'时选择大小写,然后为'ABC'否则'XYZ'从测试结束。...
我有一个外部表。在尝试删除它时,我遇到以下错误Metaexception(message:java.lang.illegalArgumentException:hadoop path不能为null)(state = 08s01,code = 1)我尝试过...
我具有下表1:| yyyy_mm_dd | id |功能|状态| | ------------ |||| ----------------- | ------------- -| | 2019-05-13 | 2 |定价|已实施| | 2019-05-13 ...
增加HiveWarehouseSession中的容器大小和应用程序主内存
我们能否通过Spark中的HiveWarehouseSession增加tez容器的大小和应用程序主内存。属性:-tez.am.resource.memory.mb hive.tez.container.size