数据仓库是什么

数据库是最常听到的名词之一了,可是当提到数据仓库的时候,就会疑问,数据仓库是数据库吗? 若是不是,数据仓库是什么,用来干什么的呢? 平时遇到这个问题通常还真是很差简单明了的回答,由于也的确不是一两句话说的清的。那么数据仓库究竟是什么呢,跟数据库有什么区别呢?数据库

 

数据仓库是面向主题的 集成的 相对稳定的 反映历史变化的数据集合,目的在于支持决策ide

  1. 面向主题spa

    • 面向主题跟面向应用相对应。面向应用是指实现某种功能,数据集合也是其单一功能的数据集。而面向主题是指为了实现某个主题而产生的一个或多个的面向应用的数据集合的整合。orm

    • 举个例子,支付是一个面向应用的主体,而交易是一个面向主题的主体。由于交易是从下单,到支付等的一系列的过程的串联,支付只是其中的一环。blog

  2. 集成生命周期

    • 数据仓库的一个重要的功能是把不一样的数据源的数据汇总到一块儿。数据分析

    • 集成是指把不一样类型的数据源的数据进行整合,按照统一的形式进行集成。好比性别在一个数据源用男/女 另外一个用1/2,那么在数据仓库中咱们须要对其进行统一。it

  3. 相对稳定class

    • 数据通常有必定的生命周期,历史的数据通常不会再改变,咱们能够采用增量的策略进行数据的传输和计算。好比看订单的支付成功的相关信息,那么一旦订单支付成功以后,这个订单的支付成功相关的信息就不会在变动,因此此类的数据能够按天增量计算。引用

  4. 反映历史变化

    • 因为在数据仓库中能够存储历史的信息,那么就能够根据这些历史信息进行数据的分析来反映历史的变化。而操做型数据库通常只会某些时间段的数据。

从数据仓库的概念中也能够看出来数据仓库作的事情确实跟数据库不同。概括起来以下

  1. 数据粒度不一样。数据库存储的是操做型数据,是细节性的数据,事当前的数据,反应的是最后修改的结果。数据仓库是分析型的集成或者汇总的数据,面向主题,而且保存数据的全部历史状态。

  2. 数据生命周期不一样。数据库存的数据的生命周期比较短,不会保存好久的数据。数据仓库则须要历史数据来反映趋势的变化和数据分析。

  3. 建模方法不一样。数据库采用范式建模,不能有冗余。数据仓库的建模方法有DW范式建模(跟数据库的范式建模也不一样)和DM维度建模等,能够存在冗余。

  4. 时间敏感度不一样。数据库的数据要求及时性很是高。数据仓库能够容忍数据的必定的延迟。

  5. 目标不一样。数据库主要面向业务处理的,而数据仓库则面向分析用户。

网上引用比较多的对比表格

相关文章
相关标签/搜索