论各种BI工具的“大数据”特性

市面上的BI工具形形色色,功能性能包装得十分亮丽,但实际应用中咱们每每更关注的是朴实的技术特性和解决方案。对于大数据,将来的应用趋势不可抵挡,不少企业也正存在大数据分析处理展示的需求,如下咱们列举市面上主流的三款BI系统,就“大数据”特性展开探讨,主要是与Hadoop、Spark、多维分析数据库的对接和性能。
Tableau的大数据策略
一、目前,Tableau适用的大数据生态系统链接包括:
Hadoop:Cloudera Impala 和 Hive、Hortonworks Hive、MapR Hive、支持 Impala 和 Hive 的Amazon EMR、Pivotal HAWQ、IBM BigInsights
NoSQL:MarkLogic、Datastax
Spark:Apache Spark SQL
多维分析数据库: Teradata Aster、HP Vertica、SAP Hana、SAP Sybase、Pivotal Greenplum前端

图片描述

二、Tableau 可实时链接到数据源,或将其调入内存。在快速交互式查询分析时,实时链接做用很大。但因为内存式分析,对硬件要求较高,数据量较大时效率会比较低。
三、面向业务用户的大数据自助式可视化。业务用户可以使用拖放操做可视化其数据,而无需编写复杂的SQL、Java代码或 MapReduce做业。Tableau简化了分析数据的任务,用户可比之前更快地从数据中发现形象可见的看法。
FineBI的双套大数据方案
一、FineBI支持的大数据生态系统链接包括
大数据平台:Vertica、GreenPlum、Apache Kylin、Impala/hive、hive、星环,
NO SQL数据库:MongoDB
多维分析数据库:Teradata、SAP Hana、Greenplum、SAP Sybase、Essbase、SSAS
二、FineBI支持FineIndex和FineDirect两种数据链接和处理模式,应对的是不一样的数据方案。
FineDirect应对的是一些须要实施展示结果,好比银行交易风险的流水分析,直接对接hadoop,kylin,greenplum等大数据平台。
FineIndex采用cube连,也就是说数据库-FineIndex-前端分析,FineIndex至关于一个中间库的形式,用来存储数据表,关联转义索引等。这些都对后续前台分析处理数据效率有很大的提高(由于直接sql取数,效率受数据库自己的限制,数据量大时,通常分析工具很容易就卡死升职内存溢出致使系统无响应)
三、用于执行跨数据源分析的数据混合。FineBI能够将大数据和其余数据源(如MySQL、Excel 文件等)混合,让用户可以跨越各类数据源存取数据,并整合到一个库内(FineIndex)。sql

图片描述

Qlikview
一、Qlikview也是基于内存的BI,能实时响应用户的分析需求,与Tableau类似,性能大多决定于数据库。能直接从用户的业务系统中采集数据并进行多维分析,剔除了传统BI基于数据仓库(集市)才能实施的弊病。(做者从网上和其资料库中并无查到太多关于大数据方面的阐述,官方也并无这方面的能够宣传)。
二、QlikView的核心是一个得到专利的AQL构架。在分析时不须要传统OLAP立方体,也不必定要使用数据库,彻底利用了基础硬件平台,来对上亿的数据进行业务分析。QlikView应用使各类各样的终端用户以一个高度可视化,功能强大和创造性的方式,互动分析重要业务信息。数据库

相关文章
相关标签/搜索