以互金平台为例进行用户价值划分

 

  • 目的

经过RFM模型对平台的客户价值进行分析。根据价值情况,对用户进行分分层,以便后续观察不一样价值维度的用户行为特征,采起针对性的运营策略,该案例以互金平台为例,其实电商等分析过程也是相通的。工具

此案例使用Excel、SPSS工具进行分析,固然能够在R、Python等中实现,其实都简单。字体

  • 关键数据的获取及处理

    数据的获取spa

不一样公司对数据分析师的职位划分不同,有的公司数据分析师能够直接读取SQL中的数据,那么本身能够去处理。有的数据则也能够提出数据分析让DBA或者其余开发提供数据字内容开发

    须要的关键数据数据分析

R(Recency)最近一次消费:最近一次投资时间it

F(Frequency)消费频率:  总计投标总次数   电商

M(Monetary)消费金额:总计投资总金额im

其余数据:数据

        a、首次投资时间:咱们将FRM进行进步一的深化,不只仅是分析最近一次消费的状况,而是将用户在提取数据内的整体状况多进行分析,因此最后F、M可能是以月均的形式进行模型拟合。img

        b、提数时间:就是要进行数据分析时候的时间,咱们这里用 2016年7月20日

    

    数据处理

此次的5w条 数据都是从SQL中提取出来,并未发现缺失等状况。下面咱们须要对数据进行其余的处理,得出咱们须要的结果

                                                部分数据的截图

    计算以下数据

a、最近一次投资时间距提很多天天数:最近一次投资时间-提数时间,单位日

在Excel中的公式能够写成:=DATEDIF(C2,$G$1,"d")+1  注意要多1天  

b、用户在投时长:首次投资时间-体数时间,单位月(其实这里将首次投资时间-最近一次投资时间得到数据也比较合适这字段,表示用户投资累计投资了几个月)

在Excel中的公式能够写成:=DATEDIF(B2,$G$1,"m")+1 注意要多家1个月

c、月均投金额:总计投资总金额/ 用户在投时长

Excel公式:=D2/I2

d、月均投资次数:总投资次数/用户在投时长

Excel公式:=E2/I2

 

    对数据标准化

标准化的方式有不少种,这里咱们采用将数据取LOG的方式进行标准化,转化为无量纲的纯数值,便于不一样单位或量级的指标进行比较和加权,获得以下数据

    LOG最近一次投资时间距提很多天天数,LOG月均投资金额, LOG月均投资次数在Excel中,咱们将=“LOG”&"月均投资金额"便可得到“ LOG月均投资金额”字段,具体的计算公式为==LOG(J2)

    在这里基本上将数据处理完成,数据能够根据实际的状况对数值的格式作必定的调整,可是提醒一点,在Excel表格中数据取log后会到一些负数,这些负数在Excel变现为红色字体(以下图),咱们须要下数据格式,显示为具体的负数值,不然复制到SPSS处理时,这些值会变成缺失值,影响到聚类的效果

  • 聚类模型的拟合

    利用SPSS进行K-menas聚类

一、复制Excel列表中L( LOG 最近一次投资时间距提很多天天数)、M(LOG月均投资金额)、N(LOG 月均投资次数)数据,粘贴到SPSS中

二、SPSS中--分析--分类--K均值聚类分析

在RFM中咱们聚类数分为8类,

[选项]中可勾选初始聚类中心、ANOVA表

[保存]中勾选聚类成员,这样等下拟合的结果就会出如今列表

[迭代]能够将次数设置大点,这里设置300,若是数据还未收敛,那么能够设置更大的值

拟合完成的效果

将聚类的数值QCL_1复制,粘贴回Excel

  • 分析分类的特征

咱们拟合出数据的聚类状况状况后,咱们能够对每一类数据进行分析,下面咱们仍是在Excel中操做,选取一些业务指标来分析这些类。

具体的指标以下,直接截图Excel的表格

一、数据表中的颜色能够经过Excel--开始--条件格式--色阶来设置

二、一些数值过大,能够除以10000,用万元表示

 

例如,以 1类别为例子,计算指标

投资金额总额(总额):

数据表中,聚类字段属于1的全部 投资金额总额的总数

Excel公式:=SUMIFS(数据源!$D:$D,数据源!$F:$F,分析!D$2)/10000

 

月均投资金额(均值)

数据表中,聚类字段属于1的月均投资金额的均值

Excel公式:=AVERAGEIFS(数据源!$K:$K,数据源!$F:$F,分析!D$2)/10000

 

月均投资次数(均值)

数据表中,聚类字段属于1的月均投资次数的均值

 

Excel公式:=AVERAGEIFS(数据源!$K:$K,数据源!$F:$F,分析!D$2)

最后一笔投资距提很多天天数(均值),能够表示用户活跃度

数据表中,聚类字段属于1的 最后一笔投资距提很多天天数的均值

 

Excel公式:=AVERAGEIFS(数据源!$H:$H,数据源!$F:$F,分析!D$2)

根据这些特征,咱们还能够将用户进行标签化,好比说,投资金额占平台25%的低7类别用户,咱们能够称为超级买家,这些能够要重点维护,第8类用户投资金额少,并且不活跃,若是预算有限制,则能够不用管这些用户

  • 用户价值分类还有其余的方式

除了聚类还能够用得分的方式来作

用四分位数,将投资金额、次数进行排名,取25%,25%-50%,50%-75%,77%-100%进行评分,而后计算分类,这种作法也是能够的

相关文章
相关标签/搜索