impala 相关问题

Apache Impala是Apache Hadoop的开源原生分析数据库。 Impala由Cloudera,MapR,Oracle和亚马逊提供。

如何使用 Docker 在 Windows 上设置 Apache Impala?

任何人都可以帮助我提供分步指南或 docker-compose.yml 文件,该文件可用于设置 Apache Impala 及其所需的服务(例如,Impala Daemon、State Store、Catalog Service、HDF)。 ..

回答 1 投票 0

如何从 SQL 中的日期范围计数中排除两个不同国家的节假日

我有一张看起来像这样的桌子: 优惠 ID 子id 交易开始 交易结束 国家_A 国家_B 10 1 2024-10-21 2024-10-25 美国 俄罗斯 10 2 2024-10-21 2024-10-25 美国 中国 10 3 2024-10-21 2024-10-24 俄罗斯 美国...

回答 1 投票 0

如何从 SQL 中的日期范围计数中排除两个不同国家的节日

我有一张像这样的桌子...... 优惠 ID 子id 交易开始 交易结束 国家_A 国家_B 10 1 2024-10-21 2024-10-25 美国 俄罗斯 10 2 2024-10-21 2024-10-25 美国 中国 10 3 2024-10-21 2024-10-24 俄罗斯 ...

回答 1 投票 0

Impala 的 ROW FORMAT DELIMITED、LOCATION 和 STORED 的 PostgreSQL 等价物是什么?

我正在致力于将项目从 Impala 迁移到 PostgreSQL。在 Impala 中,我有一个具有以下存储格式和文件位置的表: 行格式分隔字段以“,”结尾 存储为

回答 1 投票 0

使用列本身的前一行值派生列?

操作 交易数量 累计数量 交易金额 购买成本 卖出比率 净成本 买 250 250 5000 5000 0 0 卖 100 150 3000 0 0.4 0 买 150 300 1500 1500 0 0 卖 225 75 4000 0 0.75 0

回答 1 投票 0

从字符串 impala 查询中提取 12 个字符

我有一列包含productID、catalogID 和organization。 例如 1000002121US200100 包含 1000002121=产品 ID、US20=目录 ID、01=产品渠道,最后 00=销售区域。 难道是……

回答 1 投票 0

Impala max() 在窗口子句上

我有一个如下所示的查询: 选择名称, 时间, MAX(数字) OVER (按名称分区 按时间排序 前 10 行之间...

回答 2 投票 0

如何将 CSV 中的数据加载到 impala 的外部表中

我正在按照此解决方案将外部表加载到 Impala 中,因为如果通过引用文件加载数据,我会得到相同的错误。 所以,如果我运行: [quickstart.cloudera:21000] > 创建外部

回答 2 投票 0

在 Impala 中解析 json 格式的字符串

我有一个包含多列的表,其中一列是json格式的字符串。示例数据如下所示。列的名称是 json_data {“A”:{“B”:“b”,“C&q...

回答 1 投票 0

从 Impala 对大型数据库进行采样的最佳查询是什么?

我在 Impala 中有一个包含超过 10 亿行的巨大表。我需要对大约 100,000 行进行多次采样。查询这些示例行的最佳方法是什么?

回答 5 投票 0

将数据推送到 Impala 时,错误包含不支持写入的分区格式:“ORC”

所以我想通过以下方式将我的 pandas dataframe 格式化表推送到 Impala 数据库: IMPALA_HOST = os.getenv('172.16.16.10') conn = 连接(主机=host_impala,端口=21050) 光标 = conn.cursor() def Push_h...

回答 1 投票 0

如何在Hadoop上使用运行时分区

我在hadoop中有两个parquet数据源,它们都有运行时过滤器。 我有一个查询,它将每个表中的一些数据连接到一个结果集中。 每桌都有一个烤箱...

回答 1 投票 0

HUE/Impala Query 运行时不会执行

我一直在尝试运行此查询来查找匹配的帐户,每次运行查询时,HUE 环境都会完成 75%,然后就停留在那里。我不知道如何排除故障,因为我...

回答 1 投票 0

频繁两次提矿时如何统计ID

我需要帮助创建一个查询来为我提供正确的输出。 我有一个包含示例输出的表: ID 小时 1 09:00 1 11:00 2 09:00 2 11:00 3 09:00 3 10:00 3 11:00 4 09:00 4 11:00 5 1...

回答 2 投票 0

升级impyla到0.12.0后出错

我曾经使用 impyla 0.9.0 连接到 impala。但是当我将 impyla 升级到 0.12.0 后,我被告知不再需要指定协议参数,因为 impyla 只支持 HiveServer...

回答 1 投票 0

计算统计 IMPALA 结果导致 DiskErrorException

我正在尝试通过 IMPALA (在 ClouderaDataPlatform 上)在我的一个表上执行计算统计信息 (COMPUTE STATS db.table;),但仅对于该表,我遇到以下错误:

回答 1 投票 0

Impala 日期格式

我有一个 impala 表,其中 report_date 列值以 yyyyMMdd 和 yyyy-MM-dd 字符串格式存储,例如 20210923 2021-09-23 我想将它们转换为日期格式 我尝试了以下两个命令...

回答 1 投票 0

为什么GROUP_CONCAT在Impala中不按指定列排序?

我正在尝试在 Impala 中使用 GROUP_CONCAT 函数,并且我想按其中一列对结果进行排序。这是我到目前为止所拥有的: SELECT 列 1、列 2、GROUP_CONCAT(列 3 ORDER BY 列...

回答 1 投票 0

group_concat() Impala 中 order by 的替代方案

我需要在group_concat()中对文本数据进行排序。问题是每次返回不同的序列。 我尝试在子查询中排序,然后使用 group_concat(),但它仍然返回...

回答 1 投票 0

如何增加 SQL 实验室和可视化的超集行限制和超时缓存

我有一个包含 10 亿行的数据集。数据存储在 Hive 中。另外,我将 Impala 作为 Hive 和 Superset 之间的一层。在 Superset 中运行的查询具有最大行限制。 100.000。我不...

回答 6 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.