与业务系统相似,商业智能的基础是数据。可是,由于关注的重点不一样,业务系统的数据使用方式和商业智能系统有较大差异。本文主要介绍的就是如何理解商业智能所需的多维数据模型和多维数据分析。数据库
多维数据模型是为了知足用户从多角度多层次进行数据查询和分析的须要而创建起来的基于事实和维的数据库模型,其基本的应用是为了实现OLAP(Online Analytical Processing)。spa
其中,每一个维对应于模式中的一个或一组属性,而每一个单元存放某种汇集度量值,如count或sum。数据立方体提供数据的多维视图,并容许预计算和快速访问汇总数据。blog
数据立方体是一类多维矩阵,让用户从多个角度探索和分析数据集,一般是一次同时考虑三个或更多因素(维度)。数据立方体是二维表格的多维扩展,如同几何学中立方体是正方形的三维扩展同样。“立方体”这个词让咱们想起三维的物体,咱们也能够把三维的数据立方体看做是一组相似的互相叠加起来的二维表格。下面是一个数据立方体的示意图,这张图上,每个小方格表明着一个“源、路线、时间”组合下的包数和上一次的时间。ci
图1:数据立方体get
关于数据立方体,这里必须注意的是数据立方体只是多维模型的一个形象的说法。立方体其自己只有三维,但多维模型不只限于三维模型,能够组合更多的维度,但一方面是出于更方便地解释和描述,同时也是给思惟成像和想象的空间;另外一方面是为了与传统关系型数据库的二维表区别开来,因而就有了数据立方体的叫法。数据分析
在多维数据模型中,有一些基本概念,结合上面的例子,这些概念很好理解。产品
在不一样的数据分析软件或方法中,上述概念可能有不一样的表述,好比Wyn Enterprise中将“度量值”称为“度量”可是核心含义是能够举一反三的。it
多维数据模型支持多种操做,这些操做被称为多维分析操做,它们支撑着商业智能的交互性。多维分析操做包括:钻取(Drill-down)、上卷(Roll-up)、切片(Slice)、切块(Dice)以及旋转(Pivot),下面仍是以上面的数据立方体为例来逐一解释。io
图2:多维分析的基本操做数据可视化
钻取(Drill-down):在维的不一样层次间的变化,从上层降到下一层,或者说是将汇总数据拆分到更细节的数据,好比经过对2018年第二季度的总销售数据进行钻取来查看2018年第二季度四、五、6每月的消费数据,如上图;固然也能够钻取浙江省来查看杭州市、宁波市、温州市……这些城市的销售数据。
上卷(Roll-up):钻取的逆操做,即从细粒度数据向高层的聚合,如将江苏省、上海市和浙江省的销售数据进行汇总来查看江浙沪地区的销售数据,如上图。
切片(Slice):选择维中特定的值进行分析,好比只选择电子产品的销售数据,或者2010年第二季度的数据。
切块(Dice):选择维中特定区间的数据或者某批特定值进行分析,好比选择2010年第一季度到2010年第二季度的销售数据,或者是电子产品和日用品的销售数据。
旋转(Pivot):即维的位置的互换,就像是二维表的行列转换,如图中经过旋转实现产品维和地域维的互换。部分商业智能软件,如Wyn Enterprise将旋转和钻取合二为一,大大提高了数据分析的便利性。
本文介绍了商业智能的数据基础,多维数据模型与分析方法的概念。商业智能软件的核心就是从业务系统或其余数据源中抓取数据,组织成多维数据模型,而且提供一系列包括数据可视化在内的交互手段,帮助使用者进行多维数据分析。
随着时代的进步,包括Wyn Enterprise在内的商业智能软件已经可让用户经过在页面上妥妥拽拽便可完成本文中介绍的建模和分析过程,必定程度上,拉低了商业智能的门槛,让更多的企业能够经过商业智能获益。