多维分析(BI)系统后台数据源一般有三种选择。1、普通数据库;2、专业数据仓库;3、BI 系统自带的数据源。前端
可是,这三种选择都有各自的问题。普通数据库通常都是行式存储,很难得到多维分析但愿的高性能,只适用较小数据量。专业数据仓库有很多是列式存储的,性能问题不大,可是价格都比较昂贵,建设、扩展和维护成本也都很是高。BI 系统自带的数据源都比较封闭,只能为自家的 BI 前端提供支持,没法为多个不一样厂家的前端提供数据服务。数据库
集算器能够独立承担轻量级多维分析后台的做用,至关于中小型数据仓库或者数据集市。结构图以下:
集算器能够将多维分析的数据事先以列存形式存储到二进制文件中,称为组表。多维分析前端应用拖拽生成 SQL,经过集算器 JDBC 提交。集算器对组表执行 SQL 查询,将结果返回给多维分析前端。组表文件也可由集算器从各类异构数据源采集数据并计算而来。服务器
和普通数据库方案相比,集算器列存的二进制文件可以直接提高性能。而对于昂贵的专业数据库和相对封闭的 BI 自带数据源,集算器能够提供更加经济、简便的解决方案,并可以从各类异构数据源采集数据。性能
集算器有三种部署方式:一、集成在前端应用中;二、独立服务器;三、集群热备。下面介绍具体方法。spa
原文内容更加精彩,详情请阅读原文blog