数据仓库(DW)是专门构建/设计的数据库,用于帮助查询,分析和报告(生成报告)当前和历史数据。 DW是来自一个或多个不同来源的集成数据的中央存储库。数据仓库和一组数据库表之间的基本区别在于数据的组织/结构。
我尝试在Amazon Redshift中建立星系模式。我从所有尺寸开始,并通过一些解决方法使它们与SCD2-Kimball风格一起使用。现在,我正在尝试获取一些事实表...
假设我今天有几个客户,因此我要存储他们的信息,例如customer_id,customer_name,customer_emailid等。如果我的客户要离开,并且他想要他的个人信息...
我们知道行数据的数据缓存和组值的索引缓存。聚合器在操作之前是否处理所有要缓存的数据?
您可以通过以下示例来帮助我理解这一点。按cust_id,item_id分组。在有排序输入和未排序输入的两种情况下,哪些记录将处理到缓存(索引/数据)? ...
在多维数据集中,我有两个事实(处于不同的层次),分别为:FactTestScore和Fact SubjectScore。这两个事实共享两个维度-DimStudent和DimSubject。和FactTestScore ...
将最后的记录从Blob中的平面文件删除到Azure数据仓库中
我在Blob存储中有一些用管道分隔的平面文件,在每个文件中,我都有一个页眉和页脚记录,包括文件名,提取日期和记录数。我正在使用Polybase ...
我有一个小星型模式,表示Jira中问题的时间条目。我有一个IssueAttributes类型2维表,然后是一个TimeEntry事实表。尺寸表的简化视图:+ -----...
我正在研究星型模式,我想跟踪某些维度(尤其是某些列)的数据历史。是否可以使用时态表作为另一种选择?如果...
我的公司目前正在SQL Server中建立企业数据仓库。我们正在考虑使用PowerBI,但我正在努力查看PowerBI如何在数据仓库的环境中工作。对于...
我们已经创建了一些新的SSAS表格模型,它们直接从Oracle获取数据。但是经过一些测试,我们发现使用真实的客户数据(具有几百万行数据),处理...
此对Kimball组的引用指出,所有维度都应具有替代键,除了一些非常可预测的键(如日期补偿)。我的情况与SCD Type 1 Wiki ...
[您好,我正在为客户开发MS SQL Server 2017 Standard Edition数据仓库,遇到了我正在寻求建议的挑战。我有一个存放零售的相当大的事实表...
我正在学习BI开发课程,并且为了巩固到目前为止所学到的所有技能,我启动了一个动手项目(DWH设计,ETL应用程序,数据建模等)。在DWH期间...
[伙计,我有一个称为DIM_FILE的尺寸表,其中包含我们从客户那里收到的文件的信息。每个文件都有构成我的FACT表CUST_DETAIL的详细记录。在主...
因此,我正在尝试将两个相似的数据集合并到Snowflake中的单个数据集中,以确保合并后的数据集具有唯一性。。Dataset1-GA目标数据集列:ID每个记录的唯一ID ...
如何为使用Postgresql的数据仓库星型模式创建简单的日维度表?
我将如何在postgreSQL中为星型架构创建和填充简单的DAY维度表?它是数据仓库入门课程,因此它只有几个字段,但是大部分...
我正在使用Python / Pandas创建ETL。例如,提取(从多个数据源)和转换后,我将所有数据上传到s3。数据将可用于查询...
我正在使用BigQuery进行数据仓库项目。我们正在加载从各种大型机系统导出的每日文件。大多数表都有唯一的键,可用于创建2型历史记录,...
我已经在Snowflake中创建了两个表。创建或替换TRANSIENT TABLE TESTPARENT(COL1 NUMBER(38,0)NOT NULL,COL2 VARCHAR(16777216)NOT NULL,COL3 VARCHAR(16777216)NOT NULL,约束...
尺寸在多变的情况下多久更改一次?我正在查看SQL Server时态表以缓慢地更改维度(类型2)。一些维度表更新非常频繁(...
我想将数据仓库的表,proc,用户等复制到新的暂存DW中,但是我不需要任何数据。我尝试使用Redgate SQL Compare创建快照,并收到一条错误消息,提示...