如何创建正确的用户画像

做者:秦路算法

原文很长,干货不少,为了便于理解,我把文章拆分为了三期微信

今天介绍第二期:正确使用用户画像机器学习


用户画像首先是基于业务模型的。业务部门连业务模型都没有想好,数据部门只能巧妇难为无米之炊。数据部门也别关门造车,这和作产品同样,连用户需求都没有理解透彻,匆匆忙忙上线一个APP,结果无人问津。工具

理解消费者的决策,考虑业务场景,考虑业务形态,考虑业务部门的需求…这些概念说得很虚,可是一个好的用户画像离不开它们。本文没有说数据、模型和算法,是我认为,它们比技术层面更重要。学习

咱们从一个故事开始设立用户画像吧。spa

老王是一家互联网创业公司的核心人员,产品主营绿色健康沙拉,老王和绿色比较搭嘛。这家公司推出了APP专卖各式各样的沙拉,如今须要创建用户画像指导运营。.net

公司现阶段在业务层面,更关注营销和销售:如何将沙拉卖得更好。3d

下图是老王简单梳理的运营流程。code



老王将顾客按是否购买过沙拉,划分红潜在用户和新客。潜在用户是注册过APP但尚未下单,新客是只购买过一次沙拉的用户,除此之外还有老客,即消费了两次及以上的人群。orm

为了便于你们理解,我用JSON格式表示一个简易的用户画像。



为何独立出新客标签?由于老王的沙拉针对未消费用户会有新人红包引导消费,万事开头难。这也带来新客一次后再也不消费的问题,因此须要潜在、新客、老客的划分。

做为一个有追求的运营人员,划分老客也是不够,这里继续用户分层。

传统的分层用RFM三个维度衡量,沙拉的客单价比较固定,F和M取一个就够用了。老王如今计算不一样消费档次的用户留存度差别,譬如某时间段内消费达XX元的用户,在将来时间段是否依旧消费。

RFM模型是衡量客户价值和客户创利能力的重要工具和手段
最近一次消费 (Recency)
消费频率 (Frequency)
消费金额 (Monetary)

沙拉这类餐饮是高频消费,XX应该选择一个较窄的时间窗口,统计365天内的消费意义不大。还有一点须要注意的是,沙拉不一样季节的销量是有差别的,冬天沙拉确定卖的不如夏天,要综合考虑消费分布。

这里姑且定义,30天内消费200元以上为VIP用户。老王的生意若是特别好,也能够继续划分超级VIP。这种标签每每配合业务,譬如VIP有赠送饮料,优先配送的权益。非VIP人群,也须要激励往VIP发展。

画像的人口统计属性,老王靠用户填写订单上的收货人姓名搞定。籍贯年龄这几个,对沙拉生意没有特别大的帮助,难道为四川籍用户提升麻辣沙拉?

用户地址,能够经过收货地设立规则判断,好比某个地址出现X次,能够将其认为经常使用地地址。再依据送货地在写字楼仍是学校,推算用户是白领仍是学生。

老王针对不一样属性的人群,采起了特殊的运营策略。像学生群体,由于7,8月份是暑假,因此老王提早预估到校园地区的销售额降低。当9月开学季,又能对返校学生进行召回。

白领相关的群体,更关注消费体验,对价格敏感是次要的。若是平台女用户的消费占比高,老王就主打减肥功能的沙拉,而且以包月套餐的形式提升销量。



以一家沙拉店来看,老王的用户画像已经不错了,但他仍是焦头烂额,由于用户流失率开始上升。用户流失有各类各样的缘由:对手老李沙拉的竞争、沙拉的口味、用户以为性价比不高、老王不够帅等。

流失是一个老大难的预测问题。老王对流失用户的定义是30天没有消费。想要准确预测,这里得尝试用机器学习建模,技术方面先这里略过。所谓建模,最好要找到用户开始不消费的时间点以前的关键因素,但是是行为,能够是属性。

用户历史窗口内消费金额少,有可能流失;用户历史窗口内消费频次低,有可能流失;用户历史窗口内打开APP次数少,有可能流失;用户给过差评,有可能流失;用户等餐时间长,有可能流失;用户的性别差别,有可能流失;餐饮的季度因素,有可能流失…

老王依据业务,挑选了可能影响业务的特征,提交给数据组尝试预测流失。须要注意的是,这些用户行为不能反应真实的状况。你们不妨想一下,流失用户的行为,是否是一个动态的变化过程?

我曾经消费过不少次,可是忽然吃腻了,因而减小消费次数,再以后不怎么消费,最终流失。单位时间段内的消费忠诚度是梯度降低的,为了更好的描述变化过程,将时间窗口细分红多个等距段。前30-20天、前20~10天、前10天内,这种切分比前30天内能够更好地表达降低趋势,也更好的预测流失。

从老王的思路看,所谓流失,能够经过用户行为的细节预判。机器学习的建模虽然依赖统计手段,也离不开业务洞察。这里再次证实,用户画像创建在业务模型上。

流失几率解决了老王的心头之患,经过提早发现下降流失用户。挽回流失推行一段时间后,老王发现虽然流失用户减小了,可是成本提升了,由于挽回用户也是要花钱的呀。亏本可不行,老王心头又生一计,他只挽回有价值的,那种拿了红包才消费的用户老王他不要了!老王要的是真爱粉。因而他配合消费档次区别对待,虽然流失用户的数量没有控制好,可是利润提升了。

上述的用户画像,没有一个标签脱离于业务以外。基于业务场景,咱们还能想象不少用户画像的玩法。沙拉有不一样的口味,蔬果鸡肉海鲜。用户的口味偏好,能够用矩阵分解、模糊聚类或者多分类的问题计算,也以0~1之间的数字表示喜爱程度,类似的,还有价格偏好,即价格敏感度。



再深刻想一下业务场景,若是某个办公地点,天天都有五六笔的订单,分属不一样的客户不一样的时间段,外卖小哥得送个五六次,对人力成本是多大的浪费呀。运营能够在后台分析相关的数据,以团购或拼单的形式,促成订单合并,或许销售额的利润会降低,可是外卖的人力成本也节约了。这也是用画像做为数据分析的依据。

老王的运营故事说完了,如今对用户画像的创建有一套想法了吧。


本文分享自微信公众号 - SQL数据分析(dianwu_dw)。
若有侵权,请联系 support@oschina.cn 删除。
本文参与“OSC源创计划”,欢迎正在阅读的你也加入,一块儿分享。

相关文章
相关标签/搜索