做者:LogMweb
本文原载于 https://segmentfault.com/u/logm/articles,不容许转载~算法
文章中的数学公式若没法正确显示,请参见:正确显示数学公式的小技巧数据库
本文是 计算广告(第二版)
的读书笔记。segmentfault
该部分介绍在线广告的关键技术,面向技术人员。浏览器
广告投放引擎:缓存
离线数据处理:安全
在线数据处理:服务器
算法优化:cookie
架构优化:网络
倒排索引:
向量空间模型(vector space model,VSM):
拉格朗日法:带约束的优化
降低单纯形法:
最大熵与指数族分布:
混合模型和EM算法:
特征:用户行为映射到事先肯定的标签体系中,并用单位时间累积强度表示;使用滑动平均求时间窗口内的平均值;另外须要考虑:
查询拓展:
短时行为反馈与流计算:
近似最近邻语义检索(ANN):
特征:
误差与CoEC(click on expected click):
强化学习:分出一部分流量用于强化学习的探索和利用(E&E),多臂老虎机问题(multi-arm bandit,MAB);
做弊方法分类:
做弊主体:
做弊原理:
常见做弊方法: