学习数据仓库之设计

数据仓库与数据库的差异是什么呢?各自的应用场景在哪里呢?数据库

在业务系统中使用的数据库,其中通常存储的是在线交易数据,是以业务单位组织数据并进行存储的。因为数据库是面向具体的应用,如今通常采用关系模型的设计方法。经过关系模型以保证数据的原子性、一致性和完整性,消除数据冗余,通常采用符合范式的规则来约束设计。设计

数据仓库从设计之初就是为了数据分析服务的,所以在数据组织上是以面向主题进行组织和存储的。是经过在多个维度上对历史数据进行观察和分析,为决策人员提供在该关注点(主题)上的辅助决策信息。所以在设计上也不一样于数据库的关系模型,而是采用多维分析数据模型。blog

数据仓库是分析系统的数据平台,它利用从事务系统获取数据,并作汇总、加工,为决策者提供决策的依据。事务

分析系统是过后的,它要提供关注时间段内全部的有效数据。这些数据是海量的,汇总计算起来也要慢一些,可是,只要可以提供有效的分析数据就达到目的了。数据分析

 

 数据仓库有事实表和维度表。方法

事实表中通常存放的是和主题相关的度量(数值)数据以及为了和维表链接而创建的键字段,在维度表中存放的可能是维度描述信息和键字段。im

为了更好地理解,咱们能够看看这个例子:d3

对于有个商品的营销业务进行分析,下面列出了咱们的分析的需求目标、分析的维度指标、维度的层次结构等,能够更好的理解什么是事实表,什么是维度表。数据

 

 

 咱们的事实表存放的是商品的销售记录。维度表存放的是客户的信息、商品的信息等。img

相关文章
相关标签/搜索