咱们在《利用历史数据作商业预测的全过程》(如下简称前文) 一文中介绍了如何使用历史数据进行商业预测的过程。不一样的商业需求,还会有些各自的特殊性,本文将介绍如何使用预测技术来提高营销成功率。ide
1. 准备历史数据性能
在营销场景中,要预测的目标是客户的购买行为,须要搜集一些可能会影响购买行为的信息字段,好比客户的年龄、学历、工做、收入、家庭结构、生活习惯、购物偏好,以及产品的特色、促销力度等信息,收集到的相关信息越多,预测效果也会越好。3d
另外,咱们还能够根据业务特色,分地区、分客群进行预测,好比纽约的房价和中南部城市的房价彻底不同。再好比,汽车的销售,男性客户一般会关注性能,女性客户则更关注外观,还有高端客户和中低端客户的需求特色也会截然不同。不少时候区分客户群体的分析预测,要比全体直接预测效果要更好,更有针对性。blog
若是是分地区、分客群的预测,那么对应的宽表也要多准备几张,好比分 3 个客群,宽表就要对应准备 3 张。排序
2. 创建模型产品
按前文所述便可,若是有多个客群,那就须要创建多个模型。it
3. 预测客户购买清单电商
用前文的方法,能够实现预测,而后按照预测的几率结果从高到低排序,找前面几率较高的顾客来进行营销活动就能够了。排在前面的顾客的营销成功率更高。class
4. Lift 指数变量
营销场景中,除了用通用的 AUC 指标来看准确率以外,还有一个很实用的评估方法称为 Lift 曲线。Lift 表示提高指数,它的值为使用和不使用预测模型得到的结果之间的比率。以下图所示。
横坐标表示将预测几率从高到底排序取数,10,20……分别表示几率排名前 10%,20%……的客户,纵坐标表示在排名阶段对应的提高指数。例如某种产品它的基准购买率为 1.5%,也就是说不采用模型的传统营销,平均每 100 我的里会有 1.5 我的会购买该产品。而后创建模型后,经过图中的 Lift 曲线可知,排名前 5% 的数据提高度为 14.4,即平均在 100 人里会有 1.5*14.4=21.5 我的购买产品。也就是说对几率排名前 5% 的客户进行营销,要比传统营销,成功率可提升 14.4 倍。随着横坐标用户百分比的增长,lift 值呈递减趋势,对应客户的含金量也在下降,当下降到某个段就没太大营销的意义了。例如图中对于排名约前 15% 的客户来讲,lift 值都大于 1,也就是说对前 15% 的客户进行营销,成功率要高于随机选择客户。咱们能够根据这个 Lift 曲线来决定选择几率排名前多少比例的客户去作营销。Lift 曲线越陡,说明模型筛选优质客户的能力越好,如图中的 Lift 曲线就是一个还不错的模型,可以帮助咱们更有效的找到目标客户,以最低的成本找到最容易成交的客户。
5. 多产品组合购买清单
若是销售产品只有一种或少数几种,到步骤 4 就完成了。
若是销售产品种类不少,好比十几种,甚至上百种,还能够经过挖掘客户的兴趣爱好,向其推荐产品组合,来进一步提升营销成功率和营销价值。好比,银行会有几十种金融产品须要营销,家电公司会有各类家电产品须要销售,超市或电商须要售卖的产品多种多样,保险公司有各类不一样种类的保险须要营销……。
历史上很经典的啤酒和尿布的案例,就是经过挖掘数据规律将两个看似无关联的产品组合销售,使得尿布和啤酒的销量双双增长。再好比,银行的金融产品种类不少,咱们能够经过挖掘用户的购买偏好,将购买几率较高的几种产品进行组合销售。
产品组合购买清单的预测也很是简单,YModel 中有现成的功能模块。具体操做以下:
(1) 在步骤 1,准备多目标的宽表,将预测产品所需的历史信息和目标变量作到一张宽表里,以下图 y1,y2,y3……表示每种产品是否购买的历史数据,即多目标。
(2) 在步骤 2 中配置目标变量时,将单目标变量改成多目标变量,如图所示。YModel 会自动地根据用户喜爱进行产品组合。
其余的操做步骤和单产品都是相同的,预测完成后会出现相似下图的预测结果:
左侧第一列是产品组合的内容,第二列是用户购买该组合的几率,一样将结果导出后就生成了产品组合购买清单,而后能够对前面几率较高的客户进行营销。须要注意的是对于组合几率是没有 Lift 曲线的,取排名前多少的客户就视状况而定了(一般这个数必定会多于单产品的客户数)。