若是分析思惟是一种结构化思考的体现,那么数据分析思惟(简称数据思惟)则是以数据为依托的结构化分析方式。
不一样于“我以为”、“之前是怎样”、“其余人如何”这些直觉化、经验化、类比化的思考方式,数据思惟是以数据为导向,依据严格的分析、统计和证实来指导具体的应用与操做。算法
首先,要对事物自己有一个全面和客观的认识。框架
而后,肯定事物自己的关键属性、维度和分析评估体系。
分析事物各关键指标特性间的相互制约和促进力。
任何评估指标值的得出,必定有事物自己内在数据和运做机制进行支撑的,也就是说,将对事物分析后的数据映射到具体的可用的科学评价体系之上。机器学习
明确数据分析自己的目的,以终为始。
数据分析是为了能以量化的方式来分析业务问题并得出结论。
“从历史数据中得到的洞察转化为可执行的决策或推荐的过程,将IT技术、管理科学和统计学结合以解决实际问题。”工具
业务指导数据,数据驱动业务。
数据分析并非一个结果,只是过程,在这个过程当中是须要反馈和持续改进的。
学习
数据分析的三大做用,主要是:现状分析、缘由分析和预测分析。
何时开展什么样的数据分析,须要根据咱们的需求和目的来肯定。优化
对数据的变化保持敏感。
这里的“变化”不只仅来自数值自己的变更,更多的而来自“当前的数据”不一样于日常的认知和判断。
而这种“日常的认知和判断”,其实不只是长期数据观察和分析所造成的“感受”,也是你的“经历和经验”,甚至是“当前的知识结构和能力树”。
可以认识到“变化”的来源,能有效避免掉入“主观判断”的陷阱。设计
想要培养出数据敏感性和具有意识数据偏离的能力,这须要保持持久的观察和分析,以及足够的耐心和好奇心。
业务数据对应着业务流程,业务流程暗含着业务需求,业务需求来自实际运营,从实际应用中去理解数据的产生和流动,有助于准确保持数据分析的“方向”不偏离“正轨”。对象
量化是为了统一认知,而且确保路径可回溯,可复制,避免“我感受”、“我猜想”等主观判断。
路径可回溯、可复制:经过量化后的结果,许多优化的方法是能够被找到缘由而且能够被复制的。
要想作到量化,须要作到三点:创建量化体系,明确量化重点和保证数据准确性。blog
若是不能衡量,那么就不能有效增加和改进。
须要统一标准来定义和评价,这个标准就是指标。
具体的指标数值,能够避免“我以为”形成的认知陷阱,“模糊虚妄”的描述会将人带入歧途。事件
每一个阶段,都应该明确当前的业务重点;量化体系须要根据业务阶段,更改量化重点及方式。
这同时意味着:有更细节的指标及更大的监控和推广力度。
每一个阶段,都须要根据不一样的业务状况来判断当前重点,从而围绕该重点创建一套无死角的分析监控体系。
孤立的指标发挥不出数据的价值,须要创建结构化的指标体系。
不一样业务形态有不一样的指标体系,没有放之四海而皆准的模板。
指标能细分和拆解,应该根据具体的状况选择指标,
一些用于指标设计的经常使用统计学工具
一些Tips
指标维度字典(Dimension Dictionary)
明确指标的定义和解释,要求制定者必须具有深刻了解业务和拥有极高的抽象能力。
寻找业界已有量化方法并在组织内推广,将是件事半功倍的事情。
“好指标”
“坏指标”
根据“指标设计方法”创建起围绕业务的指标体系。
核心是根据业务特征肯定核心指标,在核心指标的基础上以不一样的角度进行拆解,而后再慢慢补充其余业务的指标状况。
和分析思惟的金字塔结构同样,拆解的过程依照金字塔方法论的“逐层拆解,不重不漏(MECE)”,指标呈现树状结构,构建核心是以业务流程为思路,以结构为导向。
从流程的角度搭建指标框架,能够全面的囊括用户相关数据,无有遗漏。
列举指标原则:须要有核心驱动指标。移除虚荣指标,适当的进行删减,不要为添加指标而添加指标。
若拆解出来或业务补充的指标过多,可借鉴数据仓库的“域”概念来管理这些指标。
确保准确性的方法
Double Check 的技巧
数据产品已经有成熟的数据质量管理方法;涉及了数据源,指标计算和数据呈现等各个环节的监控。
只有解决业务问题分析才能创造价值,包括我的价值和公司价值。
“忧其所虑,给其所欲”:精准理解对方需求。
数据分析方法论主要是从宏观角度指导如何进行数据分析,就像是一个数据分析的前期规划,指导着后期数据分析工做的开展。
数据分析法主要从微观角度指导如何进行数据分析,是指具体的分析方法,好比对比分析、交叉分析、相关分析、回归分析等。
维度是描述对象的参数,在具体分析中,能够把它认为是分析事物的角度。
有了维度后,就可以经过不一样的维度组合,造成数据模型,一个多维的数据立方体。
数据模型将复杂的数据以结构化的形式有序的组织起来。
数据模型能够从不一样的角度和层面来观察数据,这样提升了分析的灵活性,知足不一样的分析需求、这个过程叫作OLAP(联机分析处理)。
维度是说明和观察事物的角度,指标是衡量数据的标准。
维度是一个更大的范围,不仅是数据,好比时间维度和城市维度,咱们就没法用指标表示,而指标(留存率、跳出率、浏览时间等)却能够成为维度。
经过业务创建和筛选出指标,将指标做为维度,利用维度进行分析,通俗理解:维度>指标。
通常来讲,指标均可以做为维度使用。
对待药物,抛开剂量谈毒性;计算回报,抛开周期谈金额; 阅读书目,抛开难度谈页数;能力评估,抛开经历谈年限; 诸如此类,逻辑混乱,流氓至极!