Apache Impala是Apache Hadoop的开源原生分析数据库。 Impala由Cloudera,MapR,Oracle和亚马逊提供。
从不具有Impala JDBC驱动程序的R中连接到Impala
由于未公开的原因,我的Impala没有安装JDBC驱动程序。这使得从R到Impala的连接具有挑战性。我能够通过Putty连接(和查询)到Impala shell。 È....
我有分割平面文件组成的大黑斑羚数据库。我复制一个分区实木复合地板直接使用HDFS本地磁盘。这个分区有15GB的总并且由大量的...
我想在1小时计算每个ID记录用。我尝试了一些IMPALA查询,但没有任何的运气。我有输入数据如下:和预期产出将是:我想:选择CONCAT(...
我有发布日期的列表(一些过去和将来)和注册号码清单。发行日期2019年1月1日注册R1 R2 2019年2月1日2019年7月2日R3我...
是否黑斑羚守护程序崩溃:如果Impala的查询内存用完,会发生什么?是否写入磁盘?详细说明将帮助!
我最近开始在Hadoop环境中工作。我需要做一些基本的ETL填充几桌。目前我使用sqoop将数据导入Hadoop和使用黑斑羚shell命令...
我有一种情况找到具有parent_node_id层次结构表中的最低一级子节点如下child_node_id。源表是在蜂巢和Impala的数据库。请建议蜂巢/黑斑羚...
我有一个表,我试图让所有的用户使用SQL因帕拉有共同的destinationhostnames。代理表:sourcehostname destinationhostname COMP1 google.com COMP2 ...
Impala的查询编辑器总是显示AnalysisException
我在Windows 7计算机上运行的虚拟机快速入门Cloudera的,用的RAM 8Go和4GO专用于虚拟机。我装表从SQL数据库到蜂巢,使用Sqoop(VM Cloudera的教程练习1)...
我有父子关系最大15级。我需要找出子节点的每个父节点的所有层次结构表。我曾尝试递归查询,但它不是在蜂房的工作...
我使用concat_ws('',collect_list(field1))作为field1,但查询未在impala中运行。 impala不支持此功能吗?如果没有,那么类似操作的替代方案是什么......
我有一个带有几个WITH子句的查询,然后是一个CREATE TABLE:WITH TABLE_1 AS(SELECT * FROM SOMEWHERE_1),TABLE_2 AS(SELECT * FROM SOMEWHERE_2(CREATE ...)
在称呼大于15个字符的情况下,单词'Hi'将插入到考虑使用正则表达式函数的字段中,但不确定如何在regexp_like(salutation,>'^ [0-9] {15} $时实现此功能” ...
SELECT f.exch FROM(在sourcedesk IN时选择案例('GOBUS_NY','GOBUS_UK',...
如何使用spark sql和impala / hive删除导致NumberFormatException的标头
在使用url和jdbc读取impala时:hive2://impalajdbc.data:25004 /; auth = noSasl和spark sql val rr = sparkSession.sql(“some item item_id from someTable LIMIT 10”)它抱怨...
插入一列:received_by作为文本,格式为Day Month。即25/06/2018应于6月25日插入。格式dd / mm / yyyy应该转换为日月 - 月份应该是......
我是Impala的新手,我在Impala上做了一些测试用例。我第二次打电话时发现类似的SQL速度要快得多。例如:table1 = 4B rows table2 = 50M行1st query:select * from table1 ...
我的问题是Impala中似乎不存在EOMONTH所以我希望有一个替代EOMONTH。我只想返回与月末日期相对应的值。下边是 ...