DWH和ETL解释道

问题描述 投票:0回答:1

在这篇文章中,我不是要求任何教程,如何做某事,在这篇文章中,我问你的帮助,如果有人可以用简单的词语解释我,什么是DWH(数据仓库)什么是ETL。

当然,我谷歌和youtube很多,我发现很多文章,视频,但仍然,我不是很确定它是什么。

我为什么这么问? 在申请工作之前,我需要非常清楚。

etl dimensional-modeling
1个回答
3
投票

这个答案绝不应该被视为数据仓库的完整定义。这只是我试图以外行人的话来解释这个词。

事务(操作,OLTP)和分析(数据仓库)系统都可以使用与后端相同的RDBMS,它们可以包含完全相同的数据。但是,他们的数据模型将完全不同,因为它们针对不同的访问模式进行了优化。

在事务系统中,您通常使用单行(例如客户或发票),并且写入一致性至关重要,因此数据模型已标准化。相反,数据仓库针对读取大量行(例如上一年的所有发票)和聚合数据进行了优化,因此维度平面化(星型模式,Kimball的维度和事实)。

交易系统仅存储当前版本的实体(即当前客户的地址),而数据仓库可以使用缓慢变化的维度(SCD)来保存历史(例如,具有日期范围的客户的所有地址以指示它们中的每一个何时有效)。

ETL过程从事务系统中提取数据,将其转换为维度格式并加载到数据仓库中。

© www.soinside.com 2019 - 2024. All rights reserved.