uplift model学习笔记

1、解决的问题:git

  一般的 Propensity Model 和 Response Model 只是给目标用户打了个分,并无确保模型的结果可使得活动的提高最大化;它没有告诉市场营销人员,哪一个用户最有可能提高活动响应;算法

  所以,须要另一个统计模型,用来定向那些能够被营销推广活动明显驱动他们偏好响应的用户,也就是“营销敏感”用户;机器学习

  Uplift Model的最终目标就是找到最有可能被营销活动影响的用户,从而提高活动的反响(r(test)-r(control))、提高ROI、提高总体的市场响应率;学习

  所以,模型要避免推广预算花在优化

  (一)从购买者角度来看:设计

  (1)天然反应的用户(即不须要营销也会来的用户);(2)顽固不会响应的用户;blog

  (二)从流失者的角度来讲:get

  (1)确定的用户;it

  (2)由于进行了市场推广反而流失的用户;io

  (3)没有意识到是否有这个活动会有什么影响的用户;(即营销不敏感的用户)

2、什么是uplift model ?

  直接为treatment所带来的影响提高建模;

3、如何进行uplift modeling?(差分响应)

方法(一):

一、创建两个logistic模型

Logit(Ptest(response|X,treatment =1)) = a+ b*X +c*treatment

Logit(Pcontrol(response|X,treatment=0) ) = a + b*X 

二、将两个得分相减,计算uplift score

Score = Ptest(response|X,treatment =1) - Pcontrol(response|X,treatment =0)

方法(二):

只用一个模型,可是创建两个一样的;

一、Logit(P(reponse|X) = a + b*X + c*treatment + d* treatment *X

二、将两个得分相减获得uplift score

Score = P(response|X,treatment =1) - P(response|X,treatment =0)

 方法(三):

knn modeling

方法(四):

Naive Bayes

 4、uplift model使用过程当中须要注意的问题:

一、训练样本

  因为强化学习须要用到的是反馈数据,所以训练样本的及时及自动更新会是比较重要的方面(尤为是label的更新和实时特征的更新),才能体现出来强化学习优于机器学习的地方,使用用户反馈的标注样原本更新训练样本库,可使得反馈及时地获得学习,从而优化算法效果;

二、label设计问题

三、问题定义

  uplift的点与运营活动指标完美结合

四、冷启动策略问题

五、抽样训练时样本有偏的问题

 

 

总结:

   "Where traditional predictive modeling focuses on the outcome, uplift modeling focuses on the effectiveness of the treatment.Then, you can target resources on the cases that are likely to be positively impacted by the treatment."

  Uplift Model 的精髓是,它专一于做用以后效果的提高,所以区分出“营销/核销敏感人群”这一步特别重要,也是筛选特征的重要考虑方面;它对ROI结果的优化,不是在于模型设计的复杂,而是在于将ROI的思惟策略融入到了模型当中。

  可是其实ROI并不只仅是提高核销率,从长远的营销价值来讲,ROI最优化还须要考虑用户的终身价值,也就是对用户所投入的每一分钱,是否对该用户长远来看给企业带来的价值是最大化的。

  Uplift Model对正负样本的定义就是,with treatment 和 without treatment的时候,是否具备response。

  

上图就是uplift model的建模假设矩阵。

相关文章
相关标签/搜索