数据仓库学习笔记(一)

第一章  决策支持系统的发展数据库

    决策支持系统(decision support system ,简称dss),能够为决策者提供分析问题、创建模型、模拟决策过程和方案的环境,调用各类信息资源和分析工具,帮助决策者提升决策水平和质量,它是管理信息系统(mis)向更高一级发展而产生的先进信息管理系统。工具

    数据仓库技术就是为更好的实现DDS而出现的。
性能

    对于操做性事务处理,大多采用传统开发模式(SDLC开发周期),其步骤为:先理解需求,而后进入设计和开发阶段,数据库的设计都是创建在有了具体的需求之上的。能够想象,不一样的系统之间,需求必然也是不一样的,每开发一个新的系统,都会根据各自的需求创建一个数据系统。在不少大型企业当中,他们所在使用的软件系统有不少,不一样系统之间的实现方式、使用的数据库等都有可能存在差别,但对于决策者来讲,当他须要将多个系统中的数据进行统计分析的时候,就会遇到很大的麻烦。合理的使用数据仓库技术,能够有效的解决操做性事务处理与分析性事务处理的矛盾。学习

    数据仓库技术基于体系结构化环境,将数据存储分为了四个层次:操做层、原子/数据仓库层、部门层、个体层。操做层数据只包含面向应用的原始数据,而且主要服务于高性能事务处理领域;数据仓库层只包含面向应用的原始历史数据;部门/数据集市层则是根据最终用户的需求为知足其特殊须要而创建的。(具体能够看下《数据仓库》第一章中对数据仓库体系结构化环境的讲解)spa

    对于体系结构化环境,我理解为:操做层中的数据,就是操做型事务处理系统平常运行使用的数据(数据库/表);根据需求,按期的将操做层中的数据进行集成,传向数据仓库环境(这里的集成能够本身去查阅资料理解下,很重要的概念),集成的过程能够经过使用ETL工具来进行,能够提升效率;当须要进行数据分析系统的开发时,以数据为驱动,分析系统功能,从数据仓库层中抽取出所须要的数据放入部门/数据集市层分析使用;当有更细分的分析业务时,能够对部门层数据再次进行提取,放入个体层中,供分析使用。这样,各层之间的数据冗余就会大大下降。
设计

    总结一下,经过对第一章的学习,首先从总体上了解数据仓库是为了解决什么问题而产生的;进而经过分析数据仓库的体系结构层次了解数据仓库的体系原理;理解需求驱动开发与数据驱动开发的区别。
事务