amazon-redshift 相关问题

Amazon Redshift是一种PB级数据仓库服务,它使用现有的商业智能工具来分析数据。 Redshift是一个基于ParAccel的面向列的MPP数据库

AWS Dynamo 到 Redshift 每晚数据同步

我们有一个 dynamodb 数据库,希望每晚将数据导出到新的 redshift 数据库临时表。理想情况下,我认为如果我们只导出插入或更新,因为我...

回答 1 投票 0

错误:尚不支持这种类型的相关子查询模式

我有一个在 MySQL 上运行没有问题的子查询,我想在 AWS-Redshift 上使用相同的查询,但我收到此错误:[0A000] 错误:这种类型的相关子查询模式不是

回答 1 投票 0

如何解决无法从 Redshift Spectrum 访问 Iceberg 表的限制?

我使用 Glue 上的 Python 脚本构建和更新了不同的 Iceberg 表。我现在需要通过 Redshift Spectrum 访问它们。从文档(和一些个人测试)来看,这似乎不可能

回答 1 投票 0

如何计算 || 的出现次数在红移表中的字符串中

在 regexp_count 符号 |用于替代匹配(a|b 它匹配 a 或 b。)。但如果我有||在一个字符串中,我需要计算它的出现次数,我该怎么做?我努力了: ,正则表达式...

回答 1 投票 0

redshift 中 json 数组的逆透视

我有一张桌子: 编号 |项目 1 | [{“customer_id”:1},{“customer_id”:2}] 我如何在 Redshift 中将其转换为: 编号 |客户ID 1 | 1 1 | 2 谢谢你

回答 1 投票 0

Amazon Glue - 作业期间出现连接超时错误

我正在尝试创建从 Redshift Cluster 到 dynamoDB 的 Amazon Glue 作业。连接已建立,但出现以下错误: 调用 o160.pyWriteDynamicFra 时发生错误...

回答 1 投票 0

使用 UNLOAD 命令将 AWS Redshift 数据导出到 S3 时输出不正确

我不是数据库专家,我刚刚开始探索 Redshift。我创建了一个集群并使用他们的示例脚本来填充表。我想将数据从 Redshift 复制到 Postgres。我首先想要...

回答 2 投票 0

Redshift 到 SparkSQL

选择 案件 当 d.深度 = 'Level_4' 时 '/' || RTRIM(TRIM(SPLIT_PART(bbn.edge_path_name, '/', 3) || '/' || SPLIT_PART(bbn.edge_path_name, '/', 4) || '/' || SPLIT_PART(bbn.edge_path_name, '/ ', 5) ...

回答 1 投票 0

如何从物化视图中的 PARSE_JSON 中提取特定的键、值是 redshift

假设我期望以下 JSON: { “核心价值” } 我想创建一个将键显示为列的物化视图。数据来自 Kinesis Streaming Data s...

回答 1 投票 0

SQL 查询按缺失值的每小时桶对表进行分组

我有一个订单表,其列 order_date 是订单的时间戳。对于 ML 类型分析,我想将它们按小时分组。不幸的是,如果给定的时间没有任何或......

回答 2 投票 0

如何从 PARSE_JSON 中提取特定的键、值是 redshift

假设我期望以下 JSON: { “核心价值” } 我想创建一个将键显示为列的物化视图。数据来自 Kinesis Streaming Data。我

回答 1 投票 0

将表从 AWS PostgreSQL 复制到 Redshift 的最佳方法

我正在寻找一种将许多表从AWS PostgreSQL复制到Redshift数据库的最佳方法,如下要求: -我们需要将大约 90 个表从 7 个 AWS PostgreSQL 数据库复制到 1 个 Redshift 数据库 -完整

回答 1 投票 0

暂停 Redshift 集群是否会取消正在运行的查询,或者它们会暂停并在之后恢复吗?

我们正在处理影响我们清晨流程的 RedShift 隔夜临时查询。我想知道在清晨流程开始之前设置一个 15 分钟的快速暂停-恢复时间表是否会

回答 1 投票 0

在 Redshift 中以 24 小时时间格式转换时间戳值

我试图将一个字符串值转换为所需的 24 小时时间戳值。但它没有转换。它始终以 redshift 显示 12 小时时间戳格式。 前任: 选择 TO_TIMESTAMP ('1 月 22 日, 20...

回答 2 投票 0

Redshift + SQLAlchemy 长查询挂起

我正在做一些事情: conn_string = "postgresql+pg8000://%s:%s@%s:%d/%s" % (db_user, db_pass, 主机, 端口, schema) conn = sqlalchemy.engine.create_engine(conn_string,execution_opt...

回答 2 投票 0

模型中前 5 个值的平均值

我有一个包含很多字段的 django 模型。我正在尝试在单个查询中获取给定字段的平均值以及同一字段的前 5 个值的平均值(来自我的其他问题

回答 1 投票 0

获取 SQL 中的两个最新主要更新(及其最新的次要更新)

我在 Redshift 中有一个表,我可以通过 SQL 访问该表,并且定期向该表添加行。更新既有每月间隔(主要更新),也有较短间隔(次要更新...

回答 1 投票 0

自动化 SQL 脚本运行到 AWS redshift 环境(开发、预生产和生产)

我希望将 SQL(DML 和 DML)自动运行到 AWS redshift 集群中,即一旦有人将 SQL 文件合并到 S3 存储桶中,它就应该在配置的环境中运行,例如 dev、prepro...

回答 2 投票 0

求和值和条件语句,是或否字符串值的子查询

我需要为多列选择一个字符串值,同时还要对表中的数字列进行求和。 数据集 ID 人 费用 收入 记录 民众 ABC 12 1 2 是的 不 ABC 11 1 5 不 是的 ABC 10 50 ...

回答 1 投票 0

根据 2 列的组合删除重复项

当 hash_key 和 load_date 的组合重复时,我认为行重复。我可以使用此 CTE 找到此类行: 将 w_duplicate_rows 作为 ( 选择 hash_key、load_date、count(*)、 ...

回答 1 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.