广告点击率预估中贝叶斯平滑

广告点击率预估是一个很是经典的转化率预估问题,在互联网时代,广告做为互联网公司盈利的一种重要手段或方法,而广告又分为不少种(这部分的知识能够课后脑补一下),今天主要讲下在计算广告当中,竞价广告涉及到的ctr预估遇到的平滑问题。这里先解释一下竞价广告:简单讲来就是广告主须要在媒体投放平台投放广告,而媒体须要经过多个广告主竞价,价高者得的方式来获取利润。而这里主要介绍两种竞价方式:一、CPM方式,二、CPC方式;函数

CPM方式是按照千次展现固定的价格来收费,这里实际上不涉及竞价。而CPC是根据广告主出的低价,乘以ctr;再乘以1000获得一个最终的价格。atom

因此这里的ctr预估对于广告主来讲是很是重要的,若是ctr预估太高,致使投放成本很快用完,没法达到预期投放目标;而ctr预估太低,就没法获得曝光展现机会。spa

而CTR预估中,ctr平滑就是一个很是重要的过程:下面首先来说讲贝叶斯平滑是个什么东西3d

一、贝叶斯平滑假设前提xml

当某个广告曝光给到用户,用户点击或者不点击是服从二项分布:(通俗的理解,所谓二项分布就是n次伯努利几率分布)伯努利分布就是用户是否点击广告服从伯努利分布。即blog

因此某个广告点击率CTR能够理解成,n个用户是否点击广告的几率分布,而用户是否点击广告服从伯努利分布,n个用户,则该广告的点击率是符合二项分布,转化成最大似然估计。则是n个用户是否点击该广告的几率最大即为转化率。class

而为了求得这个最大似然估计,经过利用用户的历史数据做为先验几率,利用贝叶斯原理,预估出后验几率。这里咱们用广告的转化率CTR对应指望做为目标函数,则对应损失函数以下所示:原理

r表示根据历史获得先验几率指望,^r表示真实几率指望。即便得L(^r,r)最小。而后咱们就获得这个东西互联网

 而上式中,对于点击次数,服从的是二项分布,即f(C,I|r)Bin(r)f(C,I|r)∼Bin(r)。二项分布的共轭先验是Beta分布。Beta分布我理解是表示正负样本真实几率的一个分布,其中有两个参数,a和b,分别表示正样本个数,和负样本个数。也能够将CTR理解成是一个服从Bate分布的。因而咱们就获得下面的转化率结果:方法

 

贝叶斯平滑参数计算:

相关文章
相关标签/搜索