Apache Drill是一种适用于大规模数据集的低延迟分布式查询引擎,包括结构化和半结构化/嵌套数据。它能够以JSON和Parquet等格式查询嵌套数据并执行动态模式发现。
Apache Drill: 从Json数据中选择时创建表错误
下面的命令可以正常工作。SELECT TO_TIMESTAMP(`ts`,'yyyyMMddHHmmss') FROM dfs.tmp`maprmy.cluster.comhivecpf_sales.json 但是当我试图从select语句创建一个表时,它......
从JetBrains JDBC驱动程序执行Drill查询时出现引用错误。
我在JetBrans(Rider 2019.2)中有一个自定义的数据源驱动,它使用apache-drill-1.17.jar JDBC驱动(官方)。使用该驱动导致了这个错误。SELECT * FROM dfs.my_parquets. "Test"...。
使用Apache Drill从Azure Blob存储读取Parquet文件时出错
我目前正在尝试使用Apache Drill从Azure Blob存储读取Parquet文件。我为azure-storage-8.6.3.jar和hadoop-azure-3.2.1.jar添加了.jar文件。我能够读取JSON文件...
Apache Drill查询执行计划不使用MongoDB索引
查询计划显示的是对mongo集合中所有行进行的集合扫描。因此,我在where子句列上创建了一个索引,期望Drill选择基于...的索引...
如果我有一个可能包含null值的字符串列,我试图找出最佳实践。在SQL数据库中,null是一个合法的值,但是通过阅读我发现很多问题,并且...
如何从SAP HANA智能数据访问生成的Apache Drill中的查询中删除双引号?
我有一些配置单元表,我正在尝试使用智能数据访问虚拟表在HANA中进行访问。我正在使用MapR钻odbc驱动程序并相应地设置dsn。现在,我可以刷新我的远程设备了...
从Postgresql RDBMS插件中选择会在WITH子句组合中导致此错误。使用src AS(从dfs.test中选择“ ArticleId”,“ Test”。“ SomeParquet”,在 )中选择“ ...
Amazon linux Ec2实例显示一些最近提取的文件的uid / groupid为'1000',但是我的etc / passwd文件中没有这样的uid / gid
TL-DR:在具有Amazon Linux AMI的AWS Linux EC2中,我看到用户/ groupid拥有的某些目录/文件为'1000'。但是我没有任何用户具有此userid / groupid。我检查了我的etc / ...
我在钻取表中有一个时间戳字段(例如date_time),如何仅从同一字段中提取日期字段。在这里看到了很多日期运算功能,但没有一个起作用。这是示例...
我在3个节点上安装了Drill(1.16版),并使用分布式模式。 Becuz当我实现查询(联接多个表)时,我想分配内存使用情况。但是,当我进入Drill Web UI时,只有...
我目前正在与一个简单的项目一起使用Apache Drill查询来自Apache Kafka主题的消息。现在我在运行Apache Drill集群时遇到错误...
Windows 10上的Apache Drill 1.17.0-无法运行钻取(嵌入式模式)
详细信息:Apache Drill 1.17.0 Windows 10 64位Java JDK1.8.0_241全新安装。无法使Apache Drill成功加载。命令行:c:\ Users \ floodb \ Software \ Drill \ apache-drill-1 ....
如何在Apache Drill中为Mongo Storage插件实现内部联接的优化(下推?)>
我想扩展Apache Drill Mongo存储插件以压低INNER JOIN。因此,我想将INNER JOIN重写为mongo聚合管道。我们需要如何开始...
我正在使用Apache Drill 1.8。为了测试海豚,我用.csv制作了两个实木复合地板文件。 CSV大约为4GB,使用gz编解码器为120MB的拼花地板,以及带有快速编解码器的大约250GB的拼花地板。如...
我在具有3个节点ZK仲裁的3个节点上以分布式模式运行Apache Drill版本1.15,以查询一个150MB的小型csv文件。但是,Drill继续使用4GB-6GB的堆内存。为了测试,我有...
列名未在Apache Drill中的JDBC扫描中传递给PostgreSQL
[尝试为PostgreSQL运行SQL查询时,不是将表中的列名引用为它将*向下推送到数据库。从中选择m.id,cnt_c_no(从...中选择m_id ...
我试图连接来自不同数据源(RDBMS和json)的两个表,但是,查询成功,但是一个表(json数据源)中的数据为大写,而另一个表(RDBMS ... ...)中的数据
Apache演练无法正确解析Windows EOL的CSV文件?
好吧,让我们为某人节省8个小时的无知调试。 TL; DR:Apache演练无法正确解析Windows计算机上生成的CSV文件。这是因为默认情况下,他们的EOL设置为\ r \ n,与...
我正在尝试使用Apache Drill查询镶木地板文件。我想对值进行排序并获得FloatCol1的最大值。因此,以下查询有效。从dfs.tmp.`tmp.parquet`中选择*,顺序为...
找不到Windows类上的Apache钻GUI SQuirrel
我正在尝试在Windows 10上使用Apache钻取GUI,我已经按照其链接https://drill.apache.org/docs/using-jdbc-with-squirrel-on-windows/上的所有说明进行操作,并添加了驱动程序显示...