公司研究BI项目也有了快三个月时间,在这儿对成果作一个总结。 前端
BI流程: mysql
需求分析->维度设计->查询service->ETL倒数据->CDC监听数据库 sql
需求分析:这个过程须要肯定好数据来源(多个数据库+excel文件+日志+...),须要的数据查询项(measure值) 数据库
维度设计: oracle
分析维度出发点,几个w:who ,where,when,what,how,why 框架
建维度表 工具
经过画总线矩阵来减小事实表个数 设计
查询service:最后肯定了前端使用开源框架saiku(使用了pentaho的mondrian来提供MDX到result的处理) 日志
ETL工具:kettle(图形化界面,数据处理思想相似于awk工具) excel
CDC监听:使用tungsten(实现了mysql的log监听,但对oracle的redolog的监听实现并不完美)。