amazon-redshift 相关问题

Amazon Redshift是一种PB级数据仓库服务,它使用现有的商业智能工具来分析数据。 Redshift是一个基于ParAccel的面向列的MPP数据库

红移 | JSON 扁平化并将其存储在表中

我有一个 JSON 值 { “测试”: { “用户ID”:77777, “部分分数”:[ { “id”:2, ...

回答 1 投票 0

JSON Redshift SQL - 迭代 json 数组

我找不到使用 redshift 查询 json 对象数组的解决方案。 对于每一行,我都有一个 json 对象数组存储在列中,如下所示: [{'a':x,'b':y,'类型':z},{'a':x,'b':y,'类型...

回答 2 投票 0

将数据从 SQL Server 加载到 Elasticsearch

寻找有关将数据从 SQL Server 加载到 Elasticsearch 或任何其他数据存储中的建议。目标是实时提供交易数据以用于报告。 我们目前使用第三个

回答 2 投票 0

Redshift:如何根据条件使用不同的密钥加入

我有两个表(t1,t2)要根据id和年月YYYY-MM加入 一般来说,连接是这样的,例如: 选择 t1.id、t1.月份、t2.价格 从 t1 加入t2 在 t1.id = t2.id 和 t1.year_m...

回答 1 投票 0

如何在lambda函数中处理红移连接器

这是 lambda 函数,我在 stepfunction 中使用它,并尝试将 csv 文件加载到 redshift 表,它需要层,我也尝试通过 pip 安装,但仍然出现以下错误 导入

回答 1 投票 0

Redshift:stv_inflight 和 stv_recents 显示相互矛盾的结果

根据文档, 要确定当前正在对数据库运行哪些查询,请键入以下查询: 选择用户名、数据库名、pid、查询 来自 stv_recents 其中状态='正在运行';

回答 1 投票 0

SQL / redshift 中的另一个百分比问题

这就是我现在所在的地方...... table1 看起来像这样(是的,就像这里的大多数帖子一样,这是实际表格的总体简化) 用户身份 类型 12345 小的 67893 中等的 32389 小的 88733 中等的 ...

回答 1 投票 0

按 Redshift 中的总运行时间、执行时间、等待/队列时间列出热门查询?

我知道 Amazon 为 Redshift 提供了各种管理脚本,例如这个: https://github.com/awslabs/amazon-redshift-utils/blob/master/src/AdminScripts/top_queries.sql 其中列出了顶部

回答 3 投票 0

如何通过查询获取 Redshift 中查询的总运行时间?

我正在对 redshift 中的一些查询进行基准测试,以便我可以对我对表所做的更改做出一些明智的判断,例如添加编码和运行真空。我可以查询

回答 3 投票 0

从 databricks jdbc 连接读取数据到 redshift 时出错

我们使用 databricks 集群,在 30 分钟不活动后关闭(13.3 LTS(包括 Apache Spark 3.4.1、Scala 2.12))。 我的目标是读取红移表并将其写入雪花,我是

回答 1 投票 0

在 Redshift 中从 bigquery 实现以下内容

尝试使用listagg()但结果如下: 1 a、b、c 1 a、b、c 1 a、b、c 2 嗯 需要与 image bigquery 类似的实现: 数据 1 为 ( 选择 1 斯克, 'a' st, 时间戳('1900-05-08 04:00:00...

回答 1 投票 0

从 Kafka 读取数据到 AWS Redshift 的最佳实践

将数据从 Kafka 集群移动到 Redshift 表的最佳实践是什么? 我们有连续的数据到达 Kafka,我想将其写入 Redshift 中的表(它不必位于...

回答 2 投票 0

AWS Athena 从通过 GLUE Crawler 输入来自 S3 的 csv 创建的表返回零记录

第一部分: 我尝试在 s3 中加载的虚拟 csv 上运行胶水爬虫,它创建了一个表,但是当我尝试在 athena 中查看表并查询它时,它显示返回了零记录。 但是At中ELB的demo数据...

回答 10 投票 0

使用 RANGE 窗口框架子句将 SUM 分析函数从 PostgreSQL 移动到 Redshift

我在 PostgreSQL 中有以下代码,我需要在 Amazon Redshift 上重现该代码: 选择 * 从 ( 选择不同的 援助 , sum(a.is_batch_empty then 1 else 0 end) over (

回答 2 投票 0

将 SUM 分析函数从 PostgreSQL 移至 Redshift

我在 PostgreSQL 中有以下代码,我需要在 Amazon Redshift 上重现该代码: 选择 * 从 ( 选择不同的 援助 , sum(a.is_batch_empty then 1 else 0 end) over (

回答 1 投票 0

如何将单个对象数组从 JSON 复制到 Redshift

考虑以下 JSON 数据结构 [{“a”:1,“b”:2} ,{"a":3,"b":4} ,{"a":5,"b":6} ] 我想使用 Redshift COPY 命令复制此内容。 我认为 JsonPath 是需要的。关闭...

回答 2 投票 0

JSON 文件未加载到 redshift

我在 redshift 中使用复制命令加载 JSON 对象时遇到问题,我收到以下 JSON 格式的文件,在尝试使用复制命令时失败,但是当我调整

回答 2 投票 0

SQL 中的自定义日期范围

我正在尝试向我的 sql 查询添加日期范围。 日期范围应每季度更改一次 2024 年 4 月 1 日的示例 - 数据的日期范围应为过去 12 个月,即应查看...

回答 1 投票 0

获取每个分区第一条记录的最佳方法:FIRST_VALUE 与 ROW_NUMBER

我正在寻找使用 SQL 获取每个分区 (a,b) 的第一条记录(a,b,c 列)的最快方法。表大约有 10, 000, 000 行。 方法#1: 选择 * 从 ( 选择a、b、c, ROW_N...

回答 2 投票 0

从 Redshift 中的超类型获取值

在我的表中,我有一个名为 zip 的超级类型列。我认为列包含字典,它不是有效的 json。如何将值提取为单独的列。我的意思是 zip.zip4、zip.zip5 我尝试使用,

回答 1 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.