apache-drill 相关问题

Apache Drill是一种适用于大规模数据集的低延迟分布式查询引擎,包括结构化和半结构化/嵌套数据。它能够以JSON和Parquet等格式查询嵌套数据并执行动态模式发现。

如何快速启动apache Drill并对csv文件进行查询?

我已成功在 ubuntu 14.04 无头虚拟机上安装 apache dr。 我已经放置了一个要对其执行查询的 csv 文件。 我阅读了教程,但对我来说没有任何意义......

回答 1 投票 0

使用 apache-drill 查询文本文件中的最后一列

我无法获取最后一列值任何建议,选择列[2]或最后一列名称不起作用 我的文本文件为 策略ID~名称~账户ID 1~农银控股~12 2~XYZ 插入...

回答 1 投票 0

Apache:Drill 无法创建视图

我是 Apache Drill 的新手。我尝试将两个工作区中的文件放入一个视图中以查看便捷查询,但出现错误。 我尝试使用 SQL 语句构建视图来集成数据......

回答 1 投票 0

Apache Drill:无法读取Windows本地文件

我是Apache Drill新手,想尝试使用Apache来管理本地数据,并在json文件中配置数据存储路径,但是当我使用SQL语法查询数据时,无法读取本地数据夫...

回答 1 投票 0

在 Apache Drill UI 中为用户启用管理员访问权限

我已使用自定义身份验证器在演练中启用用户身份验证。 我正在遵循 https://drill.apache.org/docs/creating-custom-authenticators/ 的指南 狠狠地实施了班级...

回答 1 投票 0

如何在Apache Drill上连接和查询Neo4j数据库?

我正在为一个项目使用 Apache Drill 和 Neo4j 数据库。数据库需要连接到 Drill,我应该能够从 Apache Drill 查询数据。 我已经复制并粘贴了 neo4j-driver...

回答 1 投票 0

如何从 Apache Drill 中的 JSON 文件获取列名称

我正在尝试使用 Apache Drill 进行 JSON 文件验证。我正在处理线性和嵌套 JSON 数据。我已将 JSON 文件存储在 Drill tmp storage dfs/tmp/employee_src_reg_json...

回答 1 投票 0

钻探 - Azure Blob 或 Azure 文件的 Parquet IO 性能问题

问题: 从 Azure 存储读取数据时,Drill 的 Parquet 读取性能似乎要差 5 到 10 倍,并且导致无法用于更大的数据工作负载。 这似乎只是一个问题,当

回答 2 投票 0

由于 Java 路径中存在空格,Apache Drill 无法加载?

我正在尝试开始使用 Apache Drill 并遵循 10 分钟的教程。 当我运行 bin/drill-embedded 时,出现以下错误: /Users/breuds/Desktop/Drill/apache-drill-1.21.1/bin/sqlli...

回答 1 投票 0

如何在使用 apacherill 时将转义字符作为 csv 文件中列值的一部分?

我有一个像这样的csv文件- “id”^“名字”^“姓氏”^“电子邮件”^“性别” “1”^“约翰”^“143 \”^“ewilkes0@buzzfe...

回答 1 投票 0

Apache Drill 可以查询包含更新数据的文件列表吗?

我有一个很大(超过 8.5GB)的 CSV 文件,该文件在每个月的第一天更新。但从每个月的 2 号到最后一天,它可以有 JSON 格式的新更新数据。 我转换...

回答 1 投票 0

Apache Drill > sqlline:如何运行包含变量的 sql 脚本

我是Apache Drill的新手,我需要通过sqlline运行SQL脚本。在大多数SQL客户端中,是允许在sqlline中使用一些变量的,所以请问可以吗...

回答 3 投票 0

嵌入式 Apache Drill 由于 VPN 无法连接

我尝试在嵌入模式(drill-embedded)下使用 Apache Drill,但是当它启动时显示错误: 错误:连接 Drill 失败:org.apache.drill.exec.pc.RpcException:CONNECTIO...

回答 2 投票 0

使用 Apache Drill+MongoDB 创建的数据集不包含值为 null 或空数组的列

我已通过 Apache Drill 将 Apache Superset 连接到 MongoDB。在 Apache Drill Web UI 中查询时,所有数据均正确显示。 我尝试在 MongoDB 中创建一个具有架构的数据集,但它创建...

回答 1 投票 0

Apache-Drill 中的 PostgreSQL 连接

我正在尝试使用以下配置让 Apache Drill 连接到 PostgreSQL 数据库 # 存储插件-override.conf “postgresql”:{ “类型”:“jdb...

回答 2 投票 0

将 Drill 版本升级到 > 1.14.0 时出现异常 NoClassDefFoundError JniBasedUnixGroupsMapping

对于安装在 Hadoop EMR 核心节点上的 Drill 集群,我们使用基于 PAM 的身份验证。这是下面的配置。 安全.用户.auth: { 启用:真, 包裹 +=...

回答 0 投票 0

如何使用 Drill 查询 parquet 中的 WKT 列?

我想在 Apache Drill 中查询的镶木地板文件中有地理空间数据的文本 WKT 列。我正在运行 Drill 版本 1.21.1。 镶木地板文件具有这种布局(来自镶木地板工具的输出): ....

回答 0 投票 0

如何使用 Spark/Python 将 API 数据添加到我的 MongoDB 中?

我正在使用此 API https://www.balldontlie.io/api/v1/players 开发一个项目,并一直在尝试将其添加到 MongoDB 中的数据库中。 有没有办法使用 Spark 将它添加到 MongoDB 中? 我...

回答 0 投票 0

分布式钻头无法启动。"Drillbit不允许在分布式模式下绑定回环地址。"

我有(3)个CentOS8 VirtualBox虚拟机,启用了网络,每个虚拟机都分配了16GB内存。每个都有etchosts配置为这样。127.0.0.1 localhost localhost.localdomain localhost4 localhost4... ...

回答 1 投票 0

无法在分布式模式下启动钻孔机。

我正在尝试设置 drillv1.18运行。面临以下错误。drill-override.conf指向运行在12181端口的zookeeper。在分布式模式下启动时,出现以下错误......

回答 1 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.