关于数据分析,在这以前你可能听过这样的故事:算法
奥克兰“运动家球队”一反传统球队依据击球率选拔球员,经过数据分析依据“高上垒率”选取了所需的低价球员,取得20连胜最终夺冠;数据库
零售帝国沃尔玛在一次例行的数据分析以后发现: 跟尿布一块儿搭配购买最多的商品,竟是啤酒!工具
Target超市给女孩邮寄婴儿服装和孕妇服装的优惠券,比女孩的父亲更先知道了该女孩怀孕;oop
一头刚出生30天的猪,数据预测它的生长周期,进而看到“人为刀俎,我为鱼肉”;大数据
在这背后都是大量技术人员专业的规律统计、数据预测和相关性分析。spa
专业的数据分析仍是有必定技术门槛的。可是近两年,不少公司的业务都已经结合着数据分析去开展,好比产品运营须要作运营数据分析,财务管理须要作财务分析,库存管理须要分析产品流转存储,这其中最广泛应用的就是BI。设计
BI全称商业智能(Business Intelligence),在传统企业中,它是一套完整的解决方案。将企业的数据有效整合,快速制做出报表以做出决策,涉及数据仓库,ETL,OLAP,权限控制等模块。排序
BI工具主要有两种用途。hadoop
一种是利用BI制做自动化报表,数据类工做天天都会接触大量数据,而且须要整理汇总,这是一块很大的工做量。这部分工做能够交给BI自动化完成,从数据规整、建模到下载。rem
另一种是使用其可视化功能进行分析,BI的优势在于它提供比Excel更丰富的可视化功能,操做简单上手,并且美观,若是你们天天做图须要两小时,BI会缩短一半时间。
在这里,本文想强势安利一款数据BI——FineBI,探索性的分析操做、分析图表、数据挖掘,能引导数据走向真相,关键不须要写代码就能直接上手。
如下是介绍纲要:
通常要分析的数据五花八门,数据量小能够用Excel解决。数据量大,大到错综复杂各式各样亿万级数据量的企业数据库,Oracel、DB二、SAP HANA\大数据kylin、hadoop等,FineBI都能直接链接,或者直接导入本地Excel分析也行。
这里假设我已经链接好了数据源,以后要开始分析。咱们来看下FineBI是如何操做一个数据分析的:
一、准备数据:选数据表和要用到的数据字段
自助数据集这个功能里,能够自行选择数据表和须要用到的数据字段。数据太多,不知道如何入手,因此在开始分析以前,尽量明确你的分析目标是什么,而后选择做用的数据。
二、清洗数据:数据加工,规整数据
好的数据是数据分析成功的基础。通常来讲,咱们拿到数据以后,数据并非那么完美,对于自己质量不好的数据进行分析每每是南辕北辙的,得出来的分析结果也是错误的,进步还会误导咱们对事情自己的判断,作出错误的决策。因此可能咱们在开始拿到数据后,须要对数据进行梳理,这也就是咱们一般所说的数据清洗。好比某些数据缺失,好比增长一些数据字段,好比列重命名 、数据类型转换、异常值处理、合并数据等等。
在FineBI自助数据集功能里, 能够对数据实现过滤、分组汇总、新增列、字段设置、排序、合并等等操做,能够把数据进行规整。
不明白能够看下方的示意:
若是还不能明白,FineBI设置了自动数据清洗的功能,经过点击鼠标就可以完成你对有缺陷数据的清洗。
一、智能推荐图表
图表展现数据必定是最直观的。但实际上咱们可能不明白为何要选用柱状图,不知道选用了漏斗图是什么意思。当你想分析两个或者两个以上数据字段的相关性时,FineBI会自动为你选择最合适的图表,每种图表背后都有很强的数据分析算法,能够帮助你先初步了解你的数据状况,迈出数据分析的第一步。不用再花时间想用什么图表,随便拖拽就行了,所思即所见,所见即所得。
二、可视化不只是为了美,更是帮助分析
FineBI基于著名的图形语法(The Grammar Of Graphics)设计改良,提供了无限的视觉分析可能,咱们称之为“无限图表类型”。FineBI取消了传统图表类型的概念,取代以'形状'和形状对应的'颜色','大小','提示',‘标签’等属性;取消了'分类'、'系列'等概念,取代以'横轴'、 '纵轴'两个方向。
上面这句话是官方的,比较拗口。简单来说就是,FineBI既让你保留了传统固定图表的分析习惯,你能够基于智能推荐的结果去调整对应图表类型,但更打破了传统,鼓励你去基于你的思考去造成你的分析,全部形状、颜色、大小、提示、标签、图表、警惕标识都将是你思考点的体现,而再也不用图表去限制你的思考。
什么意思呢,以上面所取的数据为例,来看一个大区销售额的对比分析:
拖拽字段,智能推荐了最经常使用的柱状图。
咱们可能更习惯横向去看具体销售额的数值,从上到下去看对比状况,这时咱们但愿横纵轴切换一下分析维度,直接一键切换,能够看到切换后意外地发现造成了咱们熟悉的条形图。
甚至能够设置形状的颜色不一样来区分大区,设置形状的大小来表示销售额,甚至直接替换形状。
以上几个步骤,就是FineBI的基础操做,能够初步的丢手头的数据有个大体的了解,初步造成分析思路。
接下来就要讲讲计算处理数据的部分。
OLAP分析,老生常谈的分析技术,对数据进行钻取、放大、过滤、维度切换、跳转、联动、导出、复用等等。
经过FineBI的OALP分析,能够轻松玩转你的数据,从大到小,由浅及深,探索数据之间的深层关联。
好比对区域-门店-品牌-销售额不一样维度之间,快速进行特定区域、门店-品牌的销售额分析。
一、搭建各类业务分析模型
真正的数据分析工具,一定脱离不了数据分析模型。长期以来,数据分析的先驱和专家们,沉淀出了不可胜数经典的数据分析模型,在诸多领域和行业中获得了普遍的应用,也带来了实质的业务价值,同时,经典的数据分析模型,有利于咱们快速上手数据分析,减小自我探索过程当中的弯路。
因为FineBI能够各类处理数据:新建数据字段、介入计算公式、过滤等等,因此能再分析时搭建各类业务模型,诸如金字塔模型、KANO分析模型、RFM模型、购物篮分析模型、四象限模型等等。
以RFM模型搭建为例,从最基础的数据(下图1)到成功搭建一个RFM模型(下图2),再到进行模型应用(下图3),只要不到10分钟的实际。以前研究过RFM客户价值模型,在市面上寻找体验了许多分析工具,FineBI绝对是国内制做RFM模型最高效便捷的软件。
顾客购买的原始数据:
通过数据处理快速搭建出RFM价值模型:
二、数据挖掘和R语言
数据挖掘是结合数学统计知识,更深刻的挖掘数据之间的内在联系。好比面向过去,发现潜藏在数据表面之下的历史规律或模式,称之为描述性分析;或面向将来,对将来趋势进行预测,称之为预测性分析。
FineBI提供了5种现成的数据挖掘模型,时序预测、聚类、分类预测、回归和关联分析。也就是说,若是你想预测将来的销售额,你想智能地给用户群分类,或者你想知道短信发给哪一个用户得到的反馈可能性比较大,将会成为现实。
除此以外和集成了R语言,能够直接在FineBI中进行R语言编译,实现更多数据挖掘分析需求,一手写法,一手用FineBI出可视化报告。
预测1:基于过去的航空公司乘客数据预测将来十个月的乘客数量:
预测2:基于已有会员数据预测未注册客户的会员等级
预测3:根据花萼长度和宽度、花瓣长度和宽度来对花卉种类分类:
好马配好鞍,最终的数据分析结果天然少不了一副好的皮囊。做为一款专业的数据分析工具来说,FineBI的可视化功能也十分强大,能够制做各类可视化的报告,为数据分析锦上添花。最终数据分析的结果天然要来贴上几张可视化的图,直接来查看下FIneBI数据可视化的效果: