搞数据仓库这么久,实践中发现首先搭建数据集市,仍是清洗数据以后,直接进入数据立方体(造成维度表和实施表)造成核心数据仓库层,是个选择题...segmentfault
随后发现这其实涉及到了数据仓库的历史问题,是采用Inmon建模仍是采用Kimball建模?甚至有人称之为数据仓库界的宗教之争。下面我说一下本身的理解:架构
2000年5月,W.H.Inmon在DM Review杂志上发表一篇文章,正是揭示了他的企业信息化工厂的特色。下图是我理解的企业信息化工厂架构图:.net
数据获取到以后,先进行整理,而且要求整理的数据是知足第三范式标准的。3d
我理解,Kimball与Inmon的主要区别就是Kimball更强调一致性事实和维度,也就是一致性维度企业总线的总要做用,这样在数据仓库迭代开发过程当中更接近需求,也会提高敏捷性。一般,Kimball都是以最终任务为导向。blog
首先,在获得数据后须要先作数据的探索,深刻理解业务逻辑与数据表的关系。开发
而后,在明确数据依赖后,按照目标需求,直接生成事实表+维度表。入门
最后,(数据集市层)拆分出部分的事实表和维度表table
结果,数据集市一方面能够直接向BI环节输出数据,另外一方面也能够向数据仓库层输出数据,方便后续的多维分析。以下图:im
他们之间的区别用这个图表体现很是合适:数据
特性 | Kimball | Inmon |
---|---|---|
时间 | 快速交付 | 路漫漫其修远兮 |
开发难度 | 小 | 大 |
维护难度 | 大 | 小 |
技能要求 | 入门级 | 专家级 |
数据要求 | 特定业务 | 企业级 |
https://segmentfault.com/a/1190000006255954
http://blog.csdn.net/paicMis/article/details/53236869