Step1: 肯定权重。算法
认为R、F、M 三要素对用户行为差别的反映是同等重要的。所以选择RFM 的权重为1: 1: 1。函数
Step2: 归一化。spa
R、F、M单位不一样,数值上存在巨大的差别,所以要对RFM 分别进行归一化处理。orm
F 越大说明用户购买次数越高,M越大说明用户订购金额越大,F,M越大说明用户价值越高。R 表明用户上一次订购的时刻与研究时刻之间的时间间隔,这时间间隔越小,说明用户在这一段时间内的用户价值越高。所以,F 与M 与用户稳定程度正相关,而R 与用户稳定程度负相关,归一化时应区别处理。归一化后的数值越高,用户价值越高。排序
归一化方法:min-max标准化(Min-Max Normalization)ci
也称为离差标准化,是对原始数据的线性变换,使结果值映射到[0,1]之间。转换函数以下:io
F 、M : X’ = ( X - Xmin ) / ( Xmax - Xmin ) ——X越大,X’越大table
R: X’ = ( Xmax - X) / ( Xmax - Xmin ) ——X越小,X’越大方法
Step3: 聚类。im
采用K 均值算法进行聚类。使用K-均值聚类法时,须要预先判断其聚类的类别数。本模型中客户分类经过每一个顾客类别RFM平均值与总RFM平均值相比较来决定的,而单个指标的比较只能有两种状况:大于(等于)或小于平均值,所以可能有2 ×2 ×2 = 8种类别。标准化和肯定聚类类别数后,进行聚类分析,获得8 类客户。
Step4: 划分用户所处等级。
即划分用户得分,获得每类用户的类型,以便定性分析用户忠诚度。
将R,F,M 分别按照归一化后的数值,由高到低排序,并均分为5 个等级,数值最高的等级得分为5,最低等级得分为1。最后得出每类用户的3 个元素分别所处的等级,获得3 个分数的组合。例如,第i 个用户,其元素R 平均值较大,得分为5,元素F 得分为3,元素M 得分为2,那么第i 个用户的类型为( 5,3,2) 型。
Step5: 划分用户类型。
将8 类客户的RFM平均值与总RFM均值比较,若是单个客户类别的均值大于总均值,则给该指标一个向上的箭头“↑”标记,反之则用“↓”。样本2中的比较状况以下。
类别 |
数量 |
R均值 |
F均值 |
M均值 |
比较状况 |
客户类型 |
用户价值 |
1 |
1 |
80.00 |
1.00 |
299.00 |
↓↓↑ |
重要发展客户 |
较高 |
2 |
1 |
80.00 |
54.00 |
308.00 |
↓↑↑ |
重要保持客户 |
高 |
3 |
218 |
83.29 |
2.76 |
26.36 |
↑↑↑ |
重要挽留客户 |
较高 |
4 |
134 |
83.22 |
2.74 |
26.23 |
↓↓↓ |
新客户:重要发展客户 老客户:无价值客户 |
新:较高 |
5 |
111 |
83.26 |
2.76 |
26.26 |
↑↑↓ |
通常客户 |
通常 |
6 |
24 |
83.18 |
2.78 |
26.40 |
↓↑↑ |
重要保持客户 |
高 |
7 |
7 |
83.57 |
3.03 |
28.88 |
↑↑↑ |
重要挽留客户 |
高 |
8 |
4 |
83.53 |
2.98 |
28.10 |
↑↑↑ |
重要挽留客户 |
高 |
总均值 |
83.246 |
2.758 |
26.286 |
Step6: 用户价值指数Li。
Li = ωRCiR + ωFCiF + ωMCiM
权数ω可更具AHP法得到。聚类后,第i类R、F、M元素归一化数值的均值记为CiR、CiF、CiM。
经过计算的出的用户价值指数能够清楚比较用户价值大小。