经过RFM模型对平台的客户价值进行分析。根据价值情况,对用户进行分分层,以便后续观察不一样价值维度的用户行为特征,采起针对性的运营策略,该案例以互金平台为例,其实电商等分析过程也是相通的。工具
此案例使用Excel、SPSS工具进行分析,固然能够在R、Python等中实现,其实都简单。字体
数据的获取spa
不一样公司对数据分析师的职位划分不同,有的公司数据分析师能够直接读取SQL中的数据,那么本身能够去处理。有的数据则也能够提出数据分析让DBA或者其余开发提供数据字内容开发
须要的关键数据数据分析
R(Recency)最近一次消费:最近一次投资时间it
F(Frequency)消费频率: 总计投标总次数 电商
M(Monetary)消费金额:总计投资总金额im
其余数据:数据
a、首次投资时间:咱们将FRM进行进步一的深化,不只仅是分析最近一次消费的状况,而是将用户在提取数据内的整体状况多进行分析,因此最后F、M可能是以月均的形式进行模型拟合。img
b、提数时间:就是要进行数据分析时候的时间,咱们这里用 2016年7月20日
数据处理
此次的5w条 数据都是从SQL中提取出来,并未发现缺失等状况。下面咱们须要对数据进行其余的处理,得出咱们须要的结果
部分数据的截图
计算以下数据
a、最近一次投资时间距提很多天天数:最近一次投资时间-提数时间,单位日
在Excel中的公式能够写成:=DATEDIF(C2,$G$1,"d")+1 注意要多1天
b、用户在投时长:首次投资时间-体数时间,单位月(其实这里将首次投资时间-最近一次投资时间得到数据也比较合适这字段,表示用户投资累计投资了几个月)
在Excel中的公式能够写成:=DATEDIF(B2,$G$1,"m")+1 注意要多家1个月
c、月均投金额:总计投资总金额/ 用户在投时长
Excel公式:=D2/I2
d、月均投资次数:总投资次数/用户在投时长
Excel公式:=E2/I2
对数据标准化
标准化的方式有不少种,这里咱们采用将数据取LOG的方式进行标准化,转化为无量纲的纯数值,便于不一样单位或量级的指标进行比较和加权,获得以下数据
LOG最近一次投资时间距提很多天天数,LOG月均投资金额, LOG月均投资次数在Excel中,咱们将=“LOG”&"月均投资金额"便可得到“ LOG月均投资金额”字段,具体的计算公式为==LOG(J2)
在这里基本上将数据处理完成,数据能够根据实际的状况对数值的格式作必定的调整,可是提醒一点,在Excel表格中数据取log后会到一些负数,这些负数在Excel变现为红色字体(以下图),咱们须要下数据格式,显示为具体的负数值,不然复制到SPSS处理时,这些值会变成缺失值,影响到聚类的效果
利用SPSS进行K-menas聚类
一、复制Excel列表中L( LOG 最近一次投资时间距提很多天天数)、M(LOG月均投资金额)、N(LOG 月均投资次数)数据,粘贴到SPSS中
二、SPSS中--分析--分类--K均值聚类分析
在RFM中咱们聚类数分为8类,
[选项]中可勾选初始聚类中心、ANOVA表
[保存]中勾选聚类成员,这样等下拟合的结果就会出如今列表
[迭代]能够将次数设置大点,这里设置300,若是数据还未收敛,那么能够设置更大的值
拟合完成的效果
将聚类的数值QCL_1复制,粘贴回Excel
咱们拟合出数据的聚类状况状况后,咱们能够对每一类数据进行分析,下面咱们仍是在Excel中操做,选取一些业务指标来分析这些类。
具体的指标以下,直接截图Excel的表格
一、数据表中的颜色能够经过Excel--开始--条件格式--色阶来设置
二、一些数值过大,能够除以10000,用万元表示
例如,以 1类别为例子,计算指标
投资金额总额(总额):
数据表中,聚类字段属于1的全部 投资金额总额的总数
Excel公式:=SUMIFS(数据源!$D:$D,数据源!$F:$F,分析!D$2)/10000
月均投资金额(均值)
数据表中,聚类字段属于1的月均投资金额的均值
Excel公式:=AVERAGEIFS(数据源!$K:$K,数据源!$F:$F,分析!D$2)/10000
月均投资次数(均值)
数据表中,聚类字段属于1的月均投资次数的均值
Excel公式:=AVERAGEIFS(数据源!$K:$K,数据源!$F:$F,分析!D$2)
最后一笔投资距提很多天天数(均值),能够表示用户活跃度
数据表中,聚类字段属于1的 最后一笔投资距提很多天天数的均值
Excel公式:=AVERAGEIFS(数据源!$H:$H,数据源!$F:$F,分析!D$2)
根据这些特征,咱们还能够将用户进行标签化,好比说,投资金额占平台25%的低7类别用户,咱们能够称为超级买家,这些能够要重点维护,第8类用户投资金额少,并且不活跃,若是预算有限制,则能够不用管这些用户
除了聚类还能够用得分的方式来作
用四分位数,将投资金额、次数进行排名,取25%,25%-50%,50%-75%,77%-100%进行评分,而后计算分类,这种作法也是能够的