amazon-redshift 相关问题

Amazon Redshift是一种PB级数据仓库服务,它使用现有的商业智能工具来分析数据。 Redshift是一个基于ParAccel的面向列的MPP数据库

从 SQL Server 中的表中提取增量数据的 SQL 查询

我正在创建一个 AWS 粘合作业,以将数据从 OLTP 数据库提取到 Redshift 数据库中。我希望 SQL 查询从表中提取增量数据。 我的表有 CreatedOn 和 LastUpda 等列...

回答 1 投票 0

从 SQL Server 中的表中提取增量数据的 SQL 查询

我正在创建一个 AWS 粘合作业,以将数据从 OLTP 数据库提取到 Redshift 数据库中。我希望 SQL 查询从表中提取增量数据。 我的表有 CreatedOn 和 LastUpda 等列...

回答 1 投票 0

dbt 无法找到我在sources.yaml 中定义的源代码

我正在设置一个新的 dbt 项目并尝试定义一个源,然后在下游模型中使用它。 这是我的 resources.yml 位于 models 文件夹下 版本:2 来源: - 名称:原始 架构:

回答 1 投票 0

Redshift 1:1 左连接右表上有重复项

我有一个包含学生信息的表(其中每个学生ID都是唯一的)和一个包含GPA的表(代表具有不同时间戳的GPA,因此学生ID不是唯一的)。 学生信息选项卡...

回答 1 投票 0

查询时将 Redshift 中的空字符串和 null 字符串替换为默认字符串?

我的表有一些 null 和空字符串,当我查询表时这些看起来很难看,所以我想用其他值替换它们。我不拥有数据,所以我无法修改表本身,这需要......

回答 1 投票 0

在redshift中使用sql函数generate_series()

我想使用redshift中的生成系列功能,但没有成功。 redshift 文档说不支持。下面的代码确实有效: 选择 * 来自生成_...

回答 11 投票 0

Amazon Glue - 使用小数字段加载到 Redshift 失败

我有一个非常简单的 Glue 作业,将数据从 S3 加载到 Redshift,中间有一个 Transform 来重命名字段并更改其类型: 第一次执行运行(几乎)没有问题 - 数据已加载...

回答 1 投票 0

如何将“tbl_df”“tbl”“data.frame”对象转换为“tbl_Redshift”“tbl_dbi”“tbl_sql”“tbl_lazy”“tbl”对象进行上传?

我对使用服务器进行数据分析非常陌生,我对“tbl_df”“tbl”“data.frame”对象和“tbl_Redshift”“tbl_dbi&qu...”完全感到困惑

回答 1 投票 0

如何按截断/修改字段对 SQL 条目进行分组?

我想按 user_type 属性对表中的所有条目进行分组。然而,user_type 条目以{用户类型} {帐户创建日期} 格式存在,例如 编号 |用户类型 -------------- 01...

回答 1 投票 0

使用Pandas,使用python从excel加载数据到redshift,能够加载数据。但是当 Excel 有 20000 多行时,需要 7 个小时以上。优化方法

使用 Pandas 将数据从 Excel 文件加载到现有 Redshift 表时,我遇到性能缓慢的问题。 Excel 文件有 10+ 列和 20000+ 行,操作耗时超过...

回答 1 投票 0

为什么我的 Redshift 连接可以在 DBeaver 上工作,但不能在 VSCode SQLTools 上工作?

我对 SQL 比较陌生,但目前我正在使用 VPN 尝试连接到 Redshift 数据库。以下是一些细节 驱动程序名称:AWS / Redshift 主机:10.x.xxx.48 端口:5439 用户名...

回答 1 投票 0

如何使用“raise info”函数在 plpgSQL 中打印日期时间戳信息,以便在 Redshift 环境中进行调试

在T-SQL中,可以使用以下语句来调试脚本—— 打印 'variable1 = ' + cast(getdate() as varchar)。 如何在 redshift 环境中的 plpgSQL 中执行相同的操作?我正在使用 DBe...

回答 1 投票 0

“分组依据”未按预期分组

我创建了以下查询,旨在按日期和 30 分钟时间段分隔数据库信息。 它可能看起来很复杂,但它只是一个日期列,一个时间桶组合...

回答 1 投票 0

用重复阈值填充列

假设我有两个表a和b,每个表包含一系列日期: 表一: 日期 2020年1月1日 2020年1月2日 2020-1-3 2020-1-4 2020-1-5 2020-1-6 2020-1-7 2020-1-8 2020-1-9 2020-1-10 和选项卡...

回答 1 投票 0

无法使用 pgplsql(Redshift 环境)将记录插入到 LOOP 语句内的表中

我无法使用 PL/pgSQL(Redshift 环境)将记录插入到 LOOP 语句内的表中;除了添加插入语句之外,一切正常;并且无法创建/修改该过程...

回答 1 投票 0

星型架构的 Redshift 性能提升

我们有一个事实表和 3 个维度。 Dim 是进程,其中是进程号、状态(打开或关闭)、PK 和其他几个列 Dim是一个有多个品牌的品牌,PK等。 Dim 是供应商...

回答 1 投票 0

Redshift 解析动态 Json 字符串

我希望能够在 Redshift 中解析从存储过程传递的动态 json 字符串。我可以使用如下代码使用 postgres 来做到这一点。 从 jsonb_each_text 选择 *...

回答 2 投票 0

避免在 RA3 Redshift 集群上从快照还原后自动备份

我有一个具有 ra3 节点类型的 Redshift 集群。 当我从快照恢复集群时,它会自动触发新的备份。 这基本上没用,因为它与使用的相同......

回答 1 投票 0

展平未知长度的 JSON 数据 Redshift SQL

我有一个长度未知的 json 列 [ { “客户 ID”:90, “订单 ID”:abc1, “订阅id”:ewuq3, }, { “定制...

回答 1 投票 0

使用气流任务将 S3 文件转换为 .csv

我有一个气流任务,它从 Redshift 获取数据,从中创建一个文件并加载到 s3 存储桶中。我希望文件以 .csv 结尾,但卸载命令不允许这样做。怎么...

回答 2 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.