客户问我“数据仓库”一词的真正含义是什么。
我考虑了ETL,数据模型的细节,与NoSQL,云,“常规” DBMS,MDM(主数据管理)等的差异,但是无法用几句话来形容他。 (实际上,我进行了一些交谈,没有使他感到困惑。)
如何用1-3(或更多)句子描述“数据仓库”?
对于非技术人员,最好将其描述为“存储在专用计算机系统中的大量数据。数据通常与某些特定领域有关,并且整个系统旨在针对某些特殊任务进行快速和优化的设计。数据仓库中存储的数据主要用于分析或决策过程。“
[不确定这是否足够:)互联网上对此主题有很多引用,但是如果有人要求我提供快速定义,我将使用与我上面写的类似的东西。
至少从理论上讲,数据仓库的想法是提供来自各种现有系统的数据的合并视图,通常认为将其重写以直接合并数据是不切实际的。因此,数据仓库从那些现有系统中收集数据,并提供所有数据(至少是错觉)在一个地方,因此可以用一种方式进行查询。
(主要目的是(通常)允许现有系统中的数据之间的关联。例如,您可以比较销售人员与客户X花费的时间(存储在一个系统中)与客户X购买(存储在另一个系统中)的时间,以及客户X对他们所收到(存储,当然,在第三个系统中)。
从实际的角度来看,这通常意味着客户的想法介于定义不清和完全疯狂之间。成本和进度几乎是无法猜测的,而且可靠的估算显然是不可能的。交付他真正想要的东西几乎肯定是不可能的,要弄清楚有用的东西将花费足够的时间和工作,而第一步是使您正在做的事情听起来足够技术性,以至于他不会发脾气在得知费用和/或进度表时发动攻击。
数据仓库试图使不同的系统看起来是同质的,而与底层技术或存储机制无关。
您可能会谈到数据仓库的“原因”,但这是一个不同的问题。
哇,我正在做一些研究。我遇到的一个非常好的答案:
数据仓库...是数据交易的复制版本,特别为查询,分析和报告而结构化和构建。在一个非常简单的定义中,术语“数据仓库”是指系统地收集以有组织方式存储的数据的过程,以便可以访问和检索它们以用于将来的报告和文档分析。
来自Richard Martin的“ Data Warehouse 100 Success Secrets”
数据仓库是一个数据库,数据加载和报告系统,旨在汇总来自多个来源的数据,并以易于提取和报告的方式呈现数据。从实际的角度来看,成功的数据仓库项目的好处是:
KISS ...
[从实用的角度看:企业在变化,环境在变化,昨天的一个重要问题可能不是今天,而很可能不是明天。在首席执行官级别上处理问题时尤其如此。
数据仓库是一个关系数据库,旨在用于查询和业务分析而不是用于事务处理。它包含从事务数据派生的历史数据。业务分析师使用此历史数据来详细了解业务。
据我所知,数据仓库不过是一个用于查询和分析的关系数据库。它通常包含源自交易数据的历史数据。
数据仓库是一项综合技术,可为企业中的关键人员提供对企业中任何级别的所需信息的访问权限。它是一个企业范围的框架,允许管理所有企业信息。
简单来说...