数据分析中经常使用的数据模型

1、抽样分析模型数据库

建模方法设计

首先肯定统计的时间段,暂定为15天;从数据库中随机抽取若干名用户做为分析样本创建分析模型,模型图中假定抽样人数为100人,15天内最高使用量为200最少为15,在横坐标轴依次画出每人的使用量立柱图;而后向右侧画出最高点和最低点的水平引线;而后垂直划线链接水平线,获得上下交点之间的线段,分别在线段的中点和三分点处水平画出“中分线”“上分线”“下分线”。产品

分析方法it

根据立柱图的分布比率肯定哪条线为“多”“少”的分割线;class

  1. 高柱和低柱比较均衡,则以中分线为分割线;
  2. 广泛偏高,少许低柱,则以上分线为分割线;
  3. 广泛偏低,少许高柱,则如下分线为分割线;

优势:统计建模方便快捷;方法

缺点:不能得到准确的宏观数据,仅得到近似的参考数据。im

2、数据区间对比分析模型统计

建模方法数据

假定统计时间段为15天,抽取10000人,分别统计他们的使用量,假定最多使用量为200,最少使用量为0;模型的横坐标为使用量,纵坐标为发送人数;在横坐标上,以10条为量级,从少到多依次画出不一样数量区间的发送人数立柱图,链接主图顶部重点,获得人数波动曲线。img

分析方法

  1. 波动曲线的顶点和与顶点最近的最低点,即为使用量“多”和“少”的分水岭,链接两点,取中点画垂直线,即获得二分法的临界线,左侧为非活跃用户,右侧为活跃用户。如图示
  2. 根据柱状图在不一样量级的分布情况,也能够采用多分法细分用户类型,如图示。

3、对比分析模型曲线类型分析

利用“数量区间对比模型”分析,不只能获得分类用户量级标准、人数、和使用量数据,经过分析使用量曲线类型,能够获得产品和运营的宏观印象。如下对四种典型的曲线类型进行分析。

常见状态(产品研发和市场发展的初期)

  1. 有基本稳定的用户群
  2. 缺乏优质用户,拔高乏力
  3. 缺乏高粘度产品(功能)
  4. 基本功能还行,除了基本功能,别的不爱用

维持状态(市场发展中后期)

  1. 经过若干时间的经营,产品有必定影响,同时拥有少许fans
  2. 对初级用户的引导不够,导致中间用户空虚
  3. 产品自己或有某种缺陷,不为多数人接受,只有少数人突破瓶颈,习惯产品才成长成高级

理想状态(初、中、后期)

  1. 市场发展势头良好,用户上手快,越用越熟练,越用越喜欢
  2. 证实产品功能,用户教育俱佳
  3. 需加大对潜在用户的宣传力度,扩大用户数

严峻状态(初、中、后期)

  1. 市场发展形势不客观,用户浅尝辄止,流失严重
  2. 产品存在重大缺陷或基本功能设计实现欠佳,没法留住用户
  3. 宣传引导力度不够