presto 相关问题

Presto是一个开源的分布式SQL查询引擎,用于针对各种大小(从千兆字节到千兆字节)的数据源运行分析查询。

从 Presto 中存储为字符串的嵌套 JSON 对象中提取键/值?

我得到的负载为字符串,需要提取键“id”的所有值。 我是这样写的: JSON_EXTRACT_SCALAR(api_response, '$.0.id') 作为 extract_id 但它是提取物...

回答 1 投票 0

Presto sql:快速提取字符串中最后一次出现的字符的子字符串

我想提取字符串中最后一次出现 ref_button_id 值之后的子字符串,在本例中,字符串 'ref_button_id=pivot-rows5&ref_button_id=hhh-rows&' 会回来...

回答 1 投票 0

如何在 Presto 中验证数据是否为十六进制

如何使用 Presto sql 并检查“cola”列的值是否为十六进制?我的目标是解决数据混乱时“不是有效的 16 进制数字”的问题。 我在下面尝试过但不起作用。

回答 1 投票 0

Spark SQL、Hive 和 Presto SQL 在 Parquet 文件之上进行分析

我以 Parquet 格式存储了数 TB 的数据,用于分析用例。有多个大表也需要联接,并且查询量很大。该系统预计将高度自动化...

回答 1 投票 0

在不知道密钥的情况下提取JSON数据

我很头疼试图弄清楚如何在 Athena 中读取具有以下格式的 JSON { “id”:“1”, “键1”:{ “此处动态密钥”:[ {&

回答 1 投票 0

在不知道密钥的情况下在 Athena 中提取 JSON 数据

我很头疼试图弄清楚如何在 Athena 中读取具有以下格式的 JSON { “id”:“1”, “键1”:{ “此处动态密钥”:[ {&

回答 1 投票 0

检查数组是否包含任何非空值的最直接方法

目前正在做这个: 基数(filter(my_array, x -> x 不为空)) != 0 有没有更直接的方法?

回答 2 投票 0

在 Trino 配置文件中添加两种具有不同配置的 PostgreSQL 连接器类型

我的 PostgreSQL 实例中有两个数据库,我希望将它们连接到 Trino。我已将它们的配置添加到目录文件夹中的 postgres.properties 文件中: 连接...

回答 1 投票 0

Presto 相当于 MySQL group_concat

我是 Presto 的新手,希望获得与 MySQL 中的 group_concat 函数相同的功能。下面两个是等价的吗?如果没有,关于如何重新创建 group_concat 的任何建议

回答 4 投票 0

如何通过替换另一个数组中的值来创建数组?

我正在寻找一种方法,根据具有值映射的第二个数组的值从另一个数组创建一个数组。 例如。 表 A 有列 id、some_array 我心里有一些价值映射,

回答 1 投票 0

Athena 通过替换另一个数组中的值来创建数组

我正在寻找一种方法,根据具有值映射的第二个数组的值从另一个数组创建一个数组。 例如。 表 A 有列 id、some_array 我心里有一些价值映射,

回答 1 投票 0

当三个字段中至少有一个不为空时,SQL 查询包含行

当某个三个字段中至少有一个不为空时,我想在查询中包含一条记录。 我可能想得太多了,因为还有其他“AND”子句......

回答 3 投票 0

如何使用 athena 表正确配置时间戳格式列

这是我正在 Athena 中处理的盗版表配置。数据以 json gzip 文件形式存储在存储桶中。 该列是时间戳,格式为 yyyyMMddTHH:mm:ss 创建外部表 json_ta...

回答 1 投票 0

如何查询包含数组数据类型的属性?

我有这个数据类型为数组的值> [ {id=gid://test/1234, name=尺寸, 值=[L, M, S, XS]}, {id=gid://test/12345,名称...

回答 1 投票 0

使用数组数据类型查询属性

我有数据类型数组的值> [{id=gid://test/1234, name=尺寸, 值=[L, M, S, XS]}, {id=gid://test/12345, name=颜色, v...

回答 1 投票 0

如何搜索符合条件的值

我正在寻找数据集中最好的 X% 数据,其中“最佳”被定义为具有最小的值之和。我可以通过运行一系列测试来获得我想要的结果来做到这一点:

回答 1 投票 0

在 presto 中计算置信区间

我正在寻找一个方便的查询来计算 presto 中单列的置信区间。 是否可以在没有嵌套查询的情况下执行此操作?

回答 1 投票 0

Athena 无法使用 OpenCSVSerde 解析日期

我在 S3 上有一个非常简单的 csv 文件 “我”,“d”,“f”,“s” "1","2018-01-01","1.001","很棒的东西!" "2","2018-01-02","2.002","可怕的事情!" "3","2018-01-03","3.003","我是石油人" 我正在努力...

回答 3 投票 0

保留 UNLOAD 生成的 Parquet 中的列名称大小写

默认情况下,在 Athena(可能更普遍的是 Presto/Trino)中 SELECT * 小写列名称。 我找到了一种解决方法,通过在适当的情况下显式指定列名称 SELECT SomeColumn,

回答 1 投票 0

`lag()` 与 `over` 和 `range Between` 会在前一条记录超出范围时返回一个值

我想在使用 RANGE BETWEEN 定义的分区上使用 lag() 获取先前的值。我按照文档中的示例进行操作: 带订单(custkey、订单日期、总价) 作为 ( ...

回答 1 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.