最近打算阅读一下数据仓库相关的书籍,百度了一下,有两本必读书《数据仓库工具箱》和《数据仓库》。简单介绍一下,《数据仓库》这本书更像是一本教材,里面的内容很经典;《数据仓库工具箱》看书名是一本单纯的工具书,其实里面都是实战。两本书各有千秋,我决定主要阅读《数据仓库工具箱》,今天分享第一章的内容,之后会作系列分享。安全
第一章主要介绍了维度建模的好处,Kimball的历史和技术架构,以及与其余相似架构的优劣,但其核心议题是:“如何作好数据仓库?”架构
说实话这个议题很没意思,有些枯燥,但是若是你遇到:“如何才能作好数据?为何需求一直作不完?数据的价值到底有多大?”那么这下面全是干货。工具
上面7点是数据仓库设计的目标,不太重点是最后两点网站
这个是核心,我刚开始作数据仓库的时候,设定的目标是:知足业务查询数据的需求。结果我在这个目标上不断的奔跑,差点累死。暂且不提几十个维度作笛卡尔积的查询可否实现,就算作出来了,价值是什么哪?为公司带来了多少收益?若是本身的价值不能量化,那么结果是能够想象的。因此必定要数据仓库必定要支持决策,而且知道本身支持了哪些决策。下面是书中原文:spa
数据仓库须要正确的信息以支持决策制定。DW/BI系统最重要的输出是基于分析证据所产生的决策。这些决策体现了数据仓库的影响和价值。早期用于表示DW/BI系统的称谓--决策支持系统,仍可做为开展系统设计的最好描述。
技术方案不重要,落地才重要,这里我想说的是:能够不用那些高大上的技术方案,可是不能不知道它的原理。要即知道它的优势,也知道它的不适用。设计
是否使用最佳组合产品或平台来构建您的体面的解决方案其实并不重要。若是业务群体不能接受DW/BI环境并积极使用它,就难言成功。对操做型系统来讲,用户没法对其加以选择,只能使用新系统,而对DW/BI系统来讲,与操做型系统不一样的是,它是可选的。
只有当DW/BI系统真正成为用于构建可付诸实现的信息的"简单快捷"的资源时,用户才会接受它。
这里的责任大都是如何知足用户的需求,知足用户的需求不等于他提的需求都能知足,而是充分理解他的kpi,理解他的目标,从这个方面入手知足他的需求,下面是原文:code
1、理解业务用户 1.1 理解他们的工做责任、目标和任务。 1.2 肯定商业用户在制定哪些决策时须要DW/BI系统的帮助。 1.3 识别出那些制定出高效率、高影响的决策的"最佳"用户。 1.4 发现潜在的新用户,并让他们意识到DW/BI系统可以给他们带来什么能力。 2、对业务用户发布高质量、相关的、可访问的信息和分析 2.1 选择最健壮的、可操做的数据放入DW/BI系统中,从组织机构的各类数据源中仔细选择 2.2 简化用户接口和应用,采用模板驱动方式,与用户的认知过程轮廓匹配 2.3 确保数据精确、可信,使其标识在整个企业具备一致性。 2.4 不间断地监控数据和分析的准确性。 2.5 适应用户不断变化的思惟方式、需求和业务优先级,及新数据源的可用性。 3、维护DW/BI环境 3.1 采用DW/BI系统制定的成功的业务决策,验证人员配置及要投入的开支。 3.2 按期对DW/BI系统进行更新。 3.3 保持业务用户的信任。 3.4 保持业务用户、执行赞助商和IT管理层满意度。
上面都是一些概念,下面说一下本身理解的如何作好数据仓库?blog
首先要充分理解业务过程,举例一家旅游网站,那么用户行为的简化过程就是:接口
用户访问首页 -> 用户搜索 -> 用户到list页面 -> 用户到detail页面 -> 下单 -> 成单 -> 利润
若是是管理层看用户行为数据,那么必定是看关键路径的指标,好比:u2b、u2o,通常不会看每一个路径的转化,由于他的kpi是提高总体的收入或者总体的新用户数,不必看这么仔细,发现问题找下面的人处理就行了,因此知足他的需求就是快速的给它这些指标便可资源
若是是负责用户行为的产品看数据,那么必定是看每一个路径的转化指标,由于他的kpi就是提高总体的转化,细化以后就是每一个关键节点的转化率
若是是某个大区的如责任看数据,那么必定看这个大区的u2b、u2o、利润等等,由于他的kpi就是这个大区
业务过程有不少,关键指标更多,如何作好数据仓库?就是如何指导业务,就是理解他们的工做责任、任务和目标,帮助他们找到关键指标,指导决策