数据仓库(DW)是专门构建/设计的数据库,用于帮助查询,分析和报告(生成报告)当前和历史数据。 DW是来自一个或多个不同来源的集成数据的中央存储库。数据仓库和一组数据库表之间的基本区别在于数据的组织/结构。
直接在 Redshift 中使用 RDS 的规范化表模式可以吗?有些文章说应该在数据仓库中使用星型模式等维度建模? 我有 30-40 张桌子。我的
我目前有这个查询,它通过它的 updated_at 列过滤最新记录并查找具有特定类型的行。我正在尝试展平阵列,以便我可以提取
数据库:雪花 我有一个缓慢变化的事实(是的,这是正确的,事实不是维度),它使用 EFFECTIVE_TS 和 EXPIRATION_TS 作为周期。 查询使用 BETWEEN
首先我意识到狭窄的事实表是理想的情况。 我正在设计一个专门用于引入 Power BI 的医疗保健数据仓库。我遇到的问题是我已经结束了...
这些是错误。 [加载 FactTitlesAuthors [27]] 错误:SSIS 错误代码 DTS_E_OLEDBERROR。发生 OLE DB 错误。错误代码:0x80040E21。 OLE DB 记录可用。资料来源:“
我们有一个数据工程项目,其中使用的基础设施和工具都是AWS的。比如s3作为source,glue作为ETL,Athena作为catalog和transformation,Postgres/Redshift作为Warehouse。 我是
以下场景适用于一家拥有 500 家大型杂货店的杂货连锁店,这些杂货店分布在三个州的地区。每家商店都有完整的部门,包括杂货店、冷冻食品、乳制品、肉类、
团队, 我有一个问题陈述需要使用 SQL 来解决。 场景 - 我需要根据现有列计算几列。 逻辑 - 我有一个如下所示的查找表(仅粘贴示例值...
使用 DBT +(Athena vs Redshift 或 Snowflake)作为数据仓库的比较——我应该走哪条路?
我目前正在使用 DBT 和 Athena 作为数据仓库,它能够进行转换并将数据写回 S3。我们不做任何插入/更新/删除。 我应该说我的数据量
SSAS Visual Studio 多维建模,计算字段返回无限值
我有关于发货的事实表。装运 (FACT) 包含一定数量的容器。一艘船 (Dimension) 包含最大数量的集装箱(在我的示例中为 MaxTEU)。我想计算...
我想知道是否有一个工具可以跟踪从源表到 DIM 和 FACT 表的数据路径(在 SQL Management studio 中。我是数据验证角色的新手,所以我需要如何知道的建议
OLTP 数据库是否包含历史数据,如果不包含那么OLAP 数据库如何包含历史数据? [关闭]
OLTP 数据库是否包含历史数据,如果不包含那么OLAP 数据库如何包含历史数据? OLTP 和 OLAP 有什么区别? 例如:我正在使用银行
将数据从 SAP 传输到 SQL Server 的最佳方式是什么?
我们希望基于 SAP 表从头开始构建一个新的数据仓库。对于提取、转换和加载 (ETL) 过程,我们希望使用 Microsoft SQL Server Integration Services。有...
我正在寻找数据仓库的最佳解决方案。该组织是一家相对较小的市场研究公司。因此,除了销售和内部数据外,数据源还包括大量
我必须为报告设计一个数据集市。我们有一个案例表,其中存储了患者案例数据。一个案例将只有一名患者,因此一个事实就是案例。现在万一表我们有多个...
我必须为报告设计一个数据集市。我们有一个案例表,其中存储了患者案例数据。一个案例将只有一名患者,因此一个事实就是案例。现在万一表我们有多个...
我正在寻找一个可以处理高并发点查询的数据仓库。在大多数高并发的情况下,我们希望获取整行数据。 然而,ClickHouse 速度很快,但在
我知道 Inmon 使用自上而下和 3NF 方法,而 Kimball 使用自下而上和维度方法。 3NF和dimensional modeling我都懂,但是我真的看不懂。。。
无法在 postgres 中升级 hive metastore
我正在将 Hive 从 2.3.2 升级到 3.1.3 在配置单元 Metastore 服务启动期间,我遇到了与版本相关的错误。该 Metastore 是 2.3.2 版本,它需要 3.1.3 所以我尝试使用
我正在为 POWER BI 设计数据模型。我有一个包含少量事实表和维度表的数据集市(星型模式) 例如 案例事实 - 它将拥有与特定 Ca 相关的所有数据......