amazon-redshift 相关问题

Amazon Redshift是一种PB级数据仓库服务,它使用现有的商业智能工具来分析数据。 Redshift是一个基于ParAccel的面向列的MPP数据库

使用 eventbridge 管道将动态数据插入到 redshift

我一直在使用 aws eventbridge 创建一个具有 kinesis 源的管道,源、过滤和丰富方面一切都很好。但是当我尝试将信息发送到 redshift 时,它就不会

回答 1 投票 0

如何让时间戳的时间成为整点的时间?

我正在尝试将包含分钟和秒的时间戳转换为小时间隔的时间戳 IE。 2022-05-03 11:14:59.000 变成 2022-05-03 11:00:00.000 我已经尝试过很多

回答 1 投票 0

通过VPN连接DBeaver与Redshift

目前我面临这个问题,我的 AWS Redshift 集群带有示例数据集,我想测试共享数据的不同方法。我尝试将我的集群与 Dbeaver 连接,但我总是...

回答 1 投票 0

无法从 s3 存储桶加载到 Redshift 数据库

cursor.execute(""" 从's3://BUCKETURI/output/dimDate.csv'复制dimDate 凭证 'aws_iam_role=arn:aws:iam::ACCOUNTID:role/role-s3-to-redshift-反之亦然' 分隔符 ',' 地区...

回答 1 投票 0

RedShift:利用一个子查询中的字段值作为整个查询中的字段名称来扁平化数据

我正在使用基于 postgres 的 Amazon Redshift。我有一个名为“参与”的表,其中包含有关参与的各种数据。我有另一张表,其中有多个订婚日期

回答 1 投票 0

滞后功能 - 问题

我有这样的数据: 年 价值 2022年 1000 2023年 500 我想用以前的值创建列,如下所示: 年 价值 值_PY 2022年 1000 无效的 2023年 500 1000 2024年 无效的 500 LAG()

回答 1 投票 0

如何在 aws redshift 中比较两个数组

我想查找 array1 的项目是否存在于 array2 中。 我尝试了以下操作: 选择数组('a','b','c')@>数组('a','b','c','d'); 选择数组('a','b','c') && 数组('a','b','c...

回答 1 投票 0

从生成器到 Pandas DataFrame - 如何做到这一点?

嗨,可爱的聪明人社区! 我正在尝试将 Redshift 表中的一些数据加载到 pandas DataFrame 中。我必须承认,我在大学时代并没有太多使用过 Pandas,而且更像是一个麻木的亲戚......

回答 1 投票 0

由于内部错误,Redshift 不支持这种类型的相关子查询模式

当我运行第一个查询时,一切都运行良好: 选择uid, (从 UserData 中选择前 1 个城市,其中 UserData.uid = #uids.uid 按城市分组) 来自#uids; 问题是当我按计数(城市)添加订单时,我...

回答 3 投票 0

使用 kinesis 流在 redshift 中创建物化视图

我使用下面的查询在 redshift 中创建金属化视图, `创建物化视图 test_sch."new_vw" 自动刷新 YES AS 选择近似到达时间戳, JSON_PARSE(kinesis_data...

回答 1 投票 0

如何在 Redshift 中列出所有表及其创建者(或所有者)

我认为这很简单,但我找不到在 Redshift 中列出所有表及其创建者(或所有者)的方法。欢迎任何帮助/见解。

回答 3 投票 0

从 String 到 Varchar 的红移谱类型转换

当我使用 Glue 爬虫从 S3 扫描数据时,我得到以下架构: {id:整数,值:字符串} 这是因为 Spark 以 String 类型而不是 varchar 类型写回数据。虽然有一个

回答 1 投票 0

从 redshift 中的超级字段中获取键和值

我有一个保存 JSON 格式数据的超级字段 - ** { "awsRegion": "us-west-2", “动态数据库”:{ “大约创建日期时间”:1712584702997808, “钥匙……

回答 1 投票 0

我可以使用整数列的日期部分作为 DISTKEY 吗?

目前我有一个时间戳列存储为 BIGINT (如镶木地板文件中的数据类型为 long ),我想使用日期部分作为 DISTKEY,这可能吗?我尝试使用 ALTER TABLE 表 AL...

回答 1 投票 0

降低 Redshift 查询成本

简介 我当前正在运行一个查询,据 DataEng 团队报告,该查询非常消耗资源。 我需要一些帮助来改进它/降低其成本。 案件 我有一张桌子(status_history_ta...

回答 1 投票 0

使用 regexp_replace 进行 Redshift 查询可以在 Redshift 控制台中运行,但不能在 Python lambda 中运行

我的 Redshift 表中的一个字段的结构类似于 {event_type} 2024-01-01,因此我使用 regexp_replace 从事件类型中删除日期。我通过 Python Lambda 调用 Redshift,例如...

回答 1 投票 0

具有不同值的情况

我需要计算每月有多少不同的客户访问过 tp.places,我尝试了三种不同的解决方案,但没有成功。我错过了什么? 选择 独特的 tp.place, ...

回答 1 投票 0

如何处理 Redshift 中的地图<string, string>列

我在 amazone athena 中有一个表,其列为 datatypevmap。该列称为属性,它看起来像这样(示例): {“isAutomaticRemindersEnabled”:“...

回答 1 投票 0

为什么Langchain SQL数据库连接只检测到少数现有表?

我已成功连接到 Redshift 数据库(如下所示)并获取所有表名称; conn = psycopg2.connect(主机、数据库、端口、用户名、密码) cursor.execute("从 pg_ta 选择表名...

回答 1 投票 0

Insert into() (Amazon Redshift) 时不考虑身份列

当我从一个具有标识、主键和排序键的表中选择另一个具有自己的标识、主键和排序集的表时,我最初遇到了这个问题。而不是尊重 (1...

回答 2 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.