amazon-athena 相关问题

Amazon Athena是一种针对存储在Amazon S3上的数据运行SQL查询的服务。 Amazon Athena是Amazon Web Services(AWS)的一部分。

使 date_trunc() 在星期日而不是星期一开始

选择 date_trunc('week',dateTime) Date_week, Max(Ranking) Runing_Total_ID from (select datetime, id , dendense_rank () over (order by datetime) as 排名 从表1) 按 1 分组 这...

回答 1 投票 0

带案例的 SQL GroupBy

我对 SQL 还很陌生,我正在尝试根据条件编写一个对 groupBy 的查询。 我想要的是 -> 对于市场 CA 和 MX,总金额基于 MARKETPLACE 和 TRANSACTION_TYPE(代码将

回答 1 投票 0

在 Athena 中使用正则表达式提取括号前的字符串值

我正在尝试了解正则表达式,并且正在尝试使用 regexp_extract 提取开括号字符之前的数据。 字符串值: 设备 iPhone-iOS-CX 12.45.0(2144) 预期输出: d...

回答 1 投票 0

AWS S3 Select 和 AWS Athena 有什么区别?

我试图了解AWS Athena服务和新发布的S3 select(仍处于预览版)之间有什么区别。 这两者的用例有何不同?似乎都有助于自我...

回答 8 投票 0

无需 Glue Crawler 将新数据插入 Athena 表?

我目前有一个管道,每 20 分钟就会将一些 JSON 文件添加到 S3 存储桶中。我想对 S3 存储桶中的数据运行一些分析。 以前我用过Glue爬虫

回答 1 投票 0

从 Notebook 实例查询 Athena 中的表/数据库

我为不同的团队开发了不同的 Athena 工作组,以便我可以将他们的查询和查询结果分开。用户希望从他们的

回答 3 投票 0

如何在 AWS Athena 中选择 JSON 数组的最后一个元素?

我的数据库有一列包含如下 JSON 数组: [ { 名称:'foo' }, { 名称:“酒吧” }, { 名称:'测试' } ] 我如何选择名称道具...

回答 1 投票 0

将新数据插入 S3 时,AWS Athena 未保持最新状态

我有AWS Athena表,我可以在S3中搜索我的数据;当我将新数据插入 S3 时,新数据在我插入之前是不可搜索的 MSCK 维修表。即使我更新的 S3 文件位于同一个

回答 1 投票 0

在 AWS Athena 中重用子查询会生成大量扫描数据

在AWS Athena上,我尝试使用WITH子句重用计算数据,例如 使用临时表 AS (...) 选择 ... 来自临时表 t0、临时表 t1、临时表 t2 在哪里 ... 如果查询速度很快,“

回答 1 投票 0

在子窗口 SQL Presto 内执行具有特定条件的值计数

假设我有一个包含 3 列的表:id、date_time、颜色。数据如下: id、日期时间、颜色 1, 2023-10-01 12:15, 绿色 1, 2023-10-01 12:16, 黄色 1, 2023-10-01 12:17, 黄色 1, 2...

回答 1 投票 0

C3P0 连接池initialPoolSize 不起作用

上下文: 我正在使用配置了 C3P0 连接池 (CP) 的 Simba JDBC 驱动程序访问 AWS Athena DB。遇到数据库连接池线程在一段时间后重新初始化,即使

回答 1 投票 0

AWS Athena 解析嵌套 JSON 数组

我有这样结构的 JSON 文件,我需要使用 AWS Athena 查询此 JSON 以提取 myarray 数组中的某些值。 最终结果应该只是 userIdentifier 和启用的值...

回答 1 投票 0

Lake Formation 与外部账户共享 - 在目标账户中使用 athena 查询时出错

我有两个帐户,源帐户(A)和目标帐户(B) 我已通过 Lakeformation 授予帐户 (B) 访问帐户 (A) 中数据库的权限。 在帐户 B 中,我接受了资源共享 a...

回答 1 投票 0

删除名称中包含“.”的 AWS Athena 表

我有一个客户端将名称类似于 foo.bar 的格式错误的表上传到 Athena 实例中。我可以使用什么语法来删除表?如果我尝试 如果存在`foo.bar`则删除表 该命令默默失败,

回答 2 投票 0

如何使用分区查询Athena获取最近一小时的记录

我在 S3 存储桶中有一些 JSON 数据,该存储桶由多个文件夹分区,每个文件夹代表一个分区,其名称与数据添加到 S3 的日期时间相对应,这里是...

回答 1 投票 0

使用 Glue + Delta Lake 在 S3 中创建 Delta 表会创建位置错误的glue 目录表

我正在使用 Delta Lake 框架使用 Glue 创建 ETL 作业。示例演示数据定义为: 数据 = {'访客': ['foo', 'bar', 'baz'], ‘id’:[1,2,3], 'B': [1, 0, 1], ...

回答 1 投票 0

如何在EC2中从AWS Athena获取数据?

我是AWS的初学者。 我的客户允许我访问 EC2 实例,并允许我使用 Athena 访问一些表。 这些表位于 AWSDataCatalog 中。我没有太多关于s的信息...

回答 1 投票 0

Athena/Trino/Presto 代码使用自定义行分隔符解析文本文件

我想使用 Trino/Presto 代码解析纯文本文件中的一些日志文件,其中记录跨越多行。我的数据如下所示:每条记录有多行,每行有一个 va...

回答 2 投票 0

AWS Athena 字符串,带有 ddmmyyyy 日期时间

我的 athena 表中有 2 列,例如 20230501 和 183434 值。每行都有不同的值。我想要一个日期类型列 2023-05-01 或用 / 分隔,只要它...

回答 1 投票 0

如何使用 Lake Formation 与外部帐户共享表

我需要与外部帐户共享在 Glue 中创建的表。 实际上,这看起来很简单,但由于某种原因,共享表没有显示在目标帐户的表列表中。 这里...

回答 2 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.