amazon-redshift 相关问题

Amazon Redshift是一种PB级数据仓库服务,它使用现有的商业智能工具来分析数据。 Redshift是一个基于ParAccel的面向列的MPP数据库

在 AWS Redshift 上安装 h3 python 库以在 UDF 中使用

我试图通过使用它来安装 ubers H3 的 python 库作为 aws redshift 的自定义库进行安装。 我遵循该过程并创建了以下函数: 创建...

回答 2 投票 0

如何更改 Redshift 中的外部架构 IAM 角色?

基于:https://docs.aws.amazon.com/redshift/latest/dg/r_CREATE_EXTERNAL_SCHEMA.html 我通过以下方式声明了我的模式: 创建外部模式spectrum_schema 来自数据目录 数据...

回答 1 投票 0

查询寻址的 S3 存储桶与该集群位于不同的区域

我刚刚开始我的 Redshift 之路之旅。我正在尝试使用复制命令加载多个 GZIP 文件并添加清单。 S3 存储桶和集群位于同一区域。我的

回答 3 投票 0

如果向 select 添加其他列,Redshift 将返回 null

我有以下选择语句 选择 ss.市场|| ss.speed_group || ss.dprt_time_segment || ss.公司|| SS季节, f9.market, --( ((从filter_9_criteria中选择*)< .5 and f9.mar...

回答 1 投票 0

特定时间段内的活跃红移用户数

我需要特定时间段(例如 4 月 20 日至 5 月 25 日)的活跃红移用户计数。 我知道 PG_user 表,但知道我正在寻找什么。 总而言之,我需要一份包含活跃用户 c 的报告...

回答 2 投票 0

无法使用 Amazon Redshift 中的数字填充临时表,行数少于预期

我正在尝试这个SQL语句: -- 创建临时表 DROP TABLE IF EXISTS 数字; 创建临时表编号 ( n INT 非空主键 ); -- 插入 1 到 25567 之间的数字 插入数字...

回答 1 投票 0

如何通过 AWS Redshift Spectrum 读取 parquet 文件中的二进制类型列?

我有一个由clickhouse生成的镶木地板文件,如果使用pyarrow显示其模式: 将 pyarrow.parquet 导入为 pq 数据 = pq.read_table('test.pqt') 打印(数据.架构) 它显示架构是这样的:

回答 1 投票 0

如何在 Amazon Redshift SQL 中创建连续整数表?

我想在 Amazon Redshift SQL 或 PostgreSQL 中创建一个表,其中包含从 0 到某个较大随机数的连续整数。这应该在不使用数组的情况下完成......

回答 1 投票 0

将生成的序列插入Redshift表中

我遇到了 Redshift 问题。我正在生成一个日期序列,并希望将其嵌入到表格中以处理该范围。但Redshift仅支持在领导节点上生成。这不是po...

回答 2 投票 0

如何将动态文件名添加到从 Redshift 卸载查询中按列分区卸载的文件中

创建临时表 temp_table ( id INT, name VARCHAR(50),age INT, city VARCHAR(50) ); INSERT INTO temp_table VALUES (1, '约翰', 25, '纽约'), (2, '简', 30, '洛杉矶'), (3, '鲍勃', 28, '别致...

回答 1 投票 0

使用存储过程将值存储在变量中

我正在尝试在 Redshift 中创建一个存储过程,该过程计算一个表中的名称数量,并将该计数存储在另一个表中,并从计数中添加日期时间和寄存器数量。 对于

回答 1 投票 0

如何选择与列不为空的下一组行相等的行数?仅适用于第一组非空行?

我有一张这样的桌子: 物品 日期 折扣 椅子 11/1/2023 无效的 椅子 11/2/2023 无效的 椅子 11/3/2023 无效的 椅子 11/4/2023 无效的 椅子 11/5/2023 无效的 椅子 11/6/2023 0.30 椅子 11/7/2023 0....

回答 1 投票 0

跨 Redshift 集群复制数据的方法比较

目前正在致力于跨 Redshift 集群复制架构和数据。 我发现了几种不同的有前途的方法,很想知道推荐哪种方法/每种方法都有什么缺点(如果我有......

回答 1 投票 0

在 Redshift 中将秒数格式化为间隔 HH:MM:SS

我正在处理数据管道中以绝对秒数表示的时间量。做类似的事情相当简单 选择42602 *间隔'1秒'; 返回 11:50:0...

回答 2 投票 0

Java 连接到 Amazon Redshift

我正在尝试使用我的 Java 代码连接到 Amazon Redshift 数据库。我在 AWS 网站上找到了一个应该可以工作的代码片段。然而,我在实现 JDBC dr 时遇到了问题...

回答 3 投票 0

SnowPlow rs 加载服务器未将数据从 s3 加载到 Redshift 集群

我已经按照 Snowplow 开源文档在 aws 上配置了 Snowplow 管道(快速启动 https://docs.snowplow.io/docs/getting-started-on-community-edition/quick-start/)。当我点击时...

回答 1 投票 0

psycopg2.OperationalError:连接到“default-workgroupxxx.redshift-serverlessx”(172.31.1.60)的服务器,端口 5439 失败:连接超时

我正在尝试使用 python psycopy2 将数据加载到 AWS Redshift Serverless #从仓库接口导入仓库 导入boto3 从 dotenv 导入 load_dotenv 导入操作系统 导入psycopg2 #任何文件...

回答 1 投票 0

在 Amazon Redshift 中动态提取数据

这是该列中的示例数据。我想动态提取仅与 5 相关的值。 '{"2113":5,"2112":5,"2114":4,"2511":5}' 最后

回答 3 投票 0

基表错误,需要保留几列不变,同时移动其他列

TL;博士 基表不正确,需要使用查询来细化数据。最终值不正确(稍少),因为嵌套本身导致一些记录遗漏,因为它是部分联接。 细节- 这我...

回答 1 投票 0

需要从 Redshift 中的查询中导出完整数据集

我正在运行一个查询,redshift 中的总记录数约为 31K。 但每次运行时,结果显示的记录数在 17K 到 18K 之间,并弹出一个错误...

回答 1 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.