Apache Drill是一种适用于大规模数据集的低延迟分布式查询引擎,包括结构化和半结构化/嵌套数据。它能够以JSON和Parquet等格式查询嵌套数据并执行动态模式发现。
如何快速启动apache Drill并对csv文件进行查询?
我已成功在 ubuntu 14.04 无头虚拟机上安装 apache dr。 我已经放置了一个要对其执行查询的 csv 文件。 我阅读了教程,但对我来说没有任何意义......
我无法获取最后一列值任何建议,选择列[2]或最后一列名称不起作用 我的文本文件为 策略ID~名称~账户ID 1~农银控股~12 2~XYZ 插入...
我是 Apache Drill 的新手。我尝试将两个工作区中的文件放入一个视图中以查看便捷查询,但出现错误。 我尝试使用 SQL 语句构建视图来集成数据......
我是Apache Drill新手,想尝试使用Apache来管理本地数据,并在json文件中配置数据存储路径,但是当我使用SQL语法查询数据时,无法读取本地数据夫...
在 Apache Drill UI 中为用户启用管理员访问权限
我已使用自定义身份验证器在演练中启用用户身份验证。 我正在遵循 https://drill.apache.org/docs/creating-custom-authenticators/ 的指南 狠狠地实施了班级...
如何在Apache Drill上连接和查询Neo4j数据库?
我正在为一个项目使用 Apache Drill 和 Neo4j 数据库。数据库需要连接到 Drill,我应该能够从 Apache Drill 查询数据。 我已经复制并粘贴了 neo4j-driver...
如何从 Apache Drill 中的 JSON 文件获取列名称
我正在尝试使用 Apache Drill 进行 JSON 文件验证。我正在处理线性和嵌套 JSON 数据。我已将 JSON 文件存储在 Drill tmp storage dfs/tmp/employee_src_reg_json...
钻探 - Azure Blob 或 Azure 文件的 Parquet IO 性能问题
问题: 从 Azure 存储读取数据时,Drill 的 Parquet 读取性能似乎要差 5 到 10 倍,并且导致无法用于更大的数据工作负载。 这似乎只是一个问题,当
由于 Java 路径中存在空格,Apache Drill 无法加载?
我正在尝试开始使用 Apache Drill 并遵循 10 分钟的教程。 当我运行 bin/drill-embedded 时,出现以下错误: /Users/breuds/Desktop/Drill/apache-drill-1.21.1/bin/sqlli...
如何在使用 apacherill 时将转义字符作为 csv 文件中列值的一部分?
我有一个像这样的csv文件- “id”^“名字”^“姓氏”^“电子邮件”^“性别” “1”^“约翰”^“143 \”^“ewilkes0@buzzfe...
Apache Drill 可以查询包含更新数据的文件列表吗?
我有一个很大(超过 8.5GB)的 CSV 文件,该文件在每个月的第一天更新。但从每个月的 2 号到最后一天,它可以有 JSON 格式的新更新数据。 我转换...
Apache Drill > sqlline:如何运行包含变量的 sql 脚本
我是Apache Drill的新手,我需要通过sqlline运行SQL脚本。在大多数SQL客户端中,是允许在sqlline中使用一些变量的,所以请问可以吗...
我尝试在嵌入模式(drill-embedded)下使用 Apache Drill,但是当它启动时显示错误: 错误:连接 Drill 失败:org.apache.drill.exec.pc.RpcException:CONNECTIO...
使用 Apache Drill+MongoDB 创建的数据集不包含值为 null 或空数组的列
我已通过 Apache Drill 将 Apache Superset 连接到 MongoDB。在 Apache Drill Web UI 中查询时,所有数据均正确显示。 我尝试在 MongoDB 中创建一个具有架构的数据集,但它创建...
我正在尝试使用以下配置让 Apache Drill 连接到 PostgreSQL 数据库 # 存储插件-override.conf “postgresql”:{ “类型”:“jdb...
将 Drill 版本升级到 > 1.14.0 时出现异常 NoClassDefFoundError JniBasedUnixGroupsMapping
对于安装在 Hadoop EMR 核心节点上的 Drill 集群,我们使用基于 PAM 的身份验证。这是下面的配置。 安全.用户.auth: { 启用:真, 包裹 +=...
如何使用 Drill 查询 parquet 中的 WKT 列?
我想在 Apache Drill 中查询的镶木地板文件中有地理空间数据的文本 WKT 列。我正在运行 Drill 版本 1.21.1。 镶木地板文件具有这种布局(来自镶木地板工具的输出): ....
如何使用 Spark/Python 将 API 数据添加到我的 MongoDB 中?
我正在使用此 API https://www.balldontlie.io/api/v1/players 开发一个项目,并一直在尝试将其添加到 MongoDB 中的数据库中。 有没有办法使用 Spark 将它添加到 MongoDB 中? 我...
分布式钻头无法启动。"Drillbit不允许在分布式模式下绑定回环地址。"
我有(3)个CentOS8 VirtualBox虚拟机,启用了网络,每个虚拟机都分配了16GB内存。每个都有etchosts配置为这样。127.0.0.1 localhost localhost.localdomain localhost4 localhost4... ...
我正在尝试设置 drillv1.18运行。面临以下错误。drill-override.conf指向运行在12181端口的zookeeper。在分布式模式下启动时,出现以下错误......