data-warehouse 相关问题

数据仓库(DW)是专门构建/设计的数据库,用于帮助查询,分析和报告(生成报告)当前和历史数据。 DW是来自一个或多个不同来源的集成数据的中央存储库。数据仓库和一组数据库表之间的基本区别在于数据的组织/结构。

如何知道将只有几个不同可能值的字段作为维度表是否是一个好的选择?

我正在尝试根据从 https://www.nyc.gov/site/tlc/about/tlc-trip-record-data.page 下载的出租车行程记录创建事实表和维度表。这是数据字典

回答 1 投票 0

具有时间维度的数据建模

用 hh:mm:ss 一起创建一个时间维度会更好还是将它们分成 3 个维度会更好,因为单独它们会占用更少的空间? 你会推荐什么...

回答 4 投票 0

Python Dagster - 如何使用增量刷新编写分区作业的计划?

我正在尝试使用 Dagster 来控制数据仓库项目的 ETL 流程,但是......我已经通读了文档并搜索了答案。看来调度程序无法支持增量刷新。喜欢

回答 0 投票 0

链接同一服务器中的两个数据仓库数据

我在一个服务器名称中有两个数据库(datawareouse-a 和 datawareouse-b)。两个数据库具有相同的设计。但是,如果我想从两个数据库中获取数据并合并所有数据表,它们......

回答 0 投票 0

Intune 数据仓库何时从 Intune 刷新其数据?

Intune 数据仓库何时从 Intune 刷新其数据?根据微软的文档,它说它每天都会刷新。 Intune 文档 https://learn.microsoft.com/en-us/mem/intune/dev...

回答 0 投票 0

将数据库对象从数据仓库导入到数据库项目时出错

我正在尝试将我的数据仓库对象导入到数据库项目中。 但在这个过程中,我遇到了以下问题,并且没有导入到项目中。知道为什么会出现这个问题吗?夏娃...

回答 1 投票 0

更新 DimEmployee 表中的 EndDate

我一直在编写脚本来创建 Type2 DimEmployee 表。我希望它在每次员工详细信息发生变化时创建一个新记录。 我相信我有这部分工作正确...

回答 0 投票 0

事实表和谷物 - 重复测量?

假设我有如下所示的表格。我正在尝试创建正确的事实表。 如果我将两个表合并为一个事实表,我将重复销售度量,因为每笔销售都包含在 ...

回答 2 投票 0

从 Google 表格管理大查询表

我有很多表 ETL 使用从谷歌表到大查询的气流,这些表使用 write truncate 方法 我有个问题。这些表格用于每周财务报告,其中...

回答 1 投票 0

免费/开源数据仓库/教学湖

我正在为数据科学项目开设 BI 课程,并希望给我的学生一些关于数据仓库/数据湖的实践练习,因为作为数据科学家/分析师,他们经常会拉动 d...

回答 0 投票 0

Salesforce 作为数据网格

Salesforce 和 Tableau 提供了一个引人注目的解决方案,使报告、分析和数据科学更接近源头。在我看来,这提供了数据网格思维(Zhamak 等)的许多好处。 我...

回答 0 投票 0

在 DWH 架构中使用消息代理(kafka)[关闭]

我建立了一个DWH架构,其中多个小型mysql数据库将被存储到一个更大的mysql数据库中。 我在源数据库中使用 Binlogs,然后使用 Nifi capturechangeMysql

回答 0 投票 0

数据仓库中两个事实表之间的关系

在我的数据库中我有发票和项目 有些发票与项目有关,有些则不相关,这意味着将根据项目详细信息和里程碑创建一些发票,其中一些在

回答 1 投票 0

如何解决这个连接表查询问题?

考虑这个查询 从 T,R 中选择 T.D,其中 T.A = R.A 且 T.B = B1 且 R.C = C1 为查询分配了 102 个缓冲区,查询的输出包含 7 行。 T 的行数 = 50,000,000 努...

回答 0 投票 0

SSIS 数据分析任务管理器

我使用 ssis,当我添加数据分析任务并选择列长度分布配置文件请求,然后我去连接管理器时,它是空的,我无法添加连接 期待...

回答 0 投票 0

在 Redshift 中直接使用 RDS 的规范化表模式

直接在 Redshift 中使用 RDS 的规范化表模式可以吗?有些文章说应该在数据仓库中使用星型模式等维度建模? 我有 30-40 张桌子。我的

回答 0 投票 0

如何在连接的雪花数据上展平数组

我目前有这个查询,它通过它的 updated_at 列过滤最新记录并查找具有特定类型的行。我正在尝试展平阵列,以便我可以提取

回答 2 投票 0

使用单个连接列替换日期范围 BETWEEN 子句

数据库:雪花 我有一个缓慢变化的事实(是的,这是正确的,事实不是维度),它使用 EFFECTIVE_TS 和 EXPIRATION_TS 作为周期。 查询使用 BETWEEN

回答 0 投票 0

宽事实表与窄事实表(Power BI)

首先我意识到狭窄的事实表是理想的情况。 我正在设计一个专门用于引入 Power BI 的医疗保健数据仓库。我遇到的问题是我已经结束了...

回答 1 投票 0

我在 SSIS 包中遇到了一些错误,我正在加载数据

这些是错误。 [加载 FactTitlesAuthors [27]] 错误:SSIS 错误代码 DTS_E_OLEDBERROR。发生 OLE DB 错误。错误代码:0x80040E21。 OLE DB 记录可用。资料来源:“

回答 1 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.