这是我阅读《互联网广告算法和系统实践》的笔记,做者王勇睿,在百度阅读上能够购买,书的篇幅很短,一天就能看完。前端
本书主要介绍了搜索广告算法、非搜索(定向)广告算法和实时竞价广告算法,为读者梳理了广告中的经常使用概念如CTR、ECPM,一个广告系统如何组成,实践中还会考虑什么问题,没有涉及多的数学和算法模型。本书适合入门,但做为小白,不少内容读完后没有具体的案例消化,理解深度上有所欠缺。我想当具有了必定的实践经验后再来翻阅此书,才能融会贯通。以后的计划是继续阅读刘鹏老师的《计算广告学》。算法
互联网广告算法和系统实践数据库
广告是由已肯定的出资人经过各类媒介进行的有关产品(商品、服务和观点)的、有偿的、有组织的、综合的、劝服性的非人员的信息传播活动。后端
广告历史安全
好创意不但能吸引人(提高CTR),并且可以抓住人(提高ROI)。cookie
对广告主,风险从大到小:CPM/CPT、CPC、CPS架构
广告系统收益指标:若千次展示的指望收益CPM值eCPM。并发
\[ x_iv_{i+1}+x_{i+1}v_{i+2}+...+x_mv_{m+1} \]app
\[ x_{i+1}v_{i+1}+x_{i+2}v_{i+2}+...+x_mv_{m}+x_{m+1}v_{m+1} \]负载均衡
\[ (x_i-x_{i+1})v_{i+1}+(x_{i+1}-x{i+2})v_{i+2}+...+(x_{m-1}-x_m)v_m+(x_m-x_{m+1})v_{m+1} \]
采用极大似然估计学习特征权重\(w\)
防止过拟合
漂移,在线学习:逻辑回归的对数似然函数具备样本可加性。
CTR预估模型效果是否好:全流量-小流量实验-离线指标验证
衡量预估CTR和真实CTR之间差别,使用AUC衡量CTR预估精度。AUC是ROC曲线下的面积。
假设正样本数M,负样本数N,计算AUC开销是M*N,经过排序减小AUC时间复杂度。
将样本按照score大小从高到低排序,score第一大样本得到n=M+N的rank值;第二大样本得到rank值为n-1。对rank为r的正样本i,组成正样本score大于负样本score的样本对个数为 r-排在i后的正样本数。
所以AUC可以下方式计算
广告主注册一个推广帐户Account,包含多个推广计划Campaign,每一个计划包含多个推广单元Group,设置Group主要须要竞价词Bidword和广告创意Creative。
一个Group完整投放需求和策略列表
搜索广告系统须要帮助广告主”充分表达本身投放需求”,给广告主提供投放基本元素。
竞价词的推荐方式
竞价词的匹配方式
推荐工具实际上找到“一座桥梁“
为了让模型特征量缩减,能够将逻辑回归目标函数修改为,模型将倾向于学习稀疏的\(w\)权重。
\[NLL(w)+\lambda\|w\|_1\]
随机梯度降低法简单易行,但每每难以获得特征向量稀疏的结果,Google提出FTRL-Proximal方法能够获得稀疏性更好的训练结果,其更新公式为:
定向广告即非搜索广告
想知道用户n对电影m的评分,须要参考与用户n类似的其余用户,用他们对m的评分来拟合n对m的评分\(r_{nm}\)。对于给定用户\(n\),他打过度的电影集合是\(M_n\),那么\(n\)的平均得分是\(r_n=\frac{1}{|M_n|}\sum_i^{\in}r_{ni}\),用户n对电影m的评分能够经过以下公式计算,
定向广告解决“这样一我的”应该配"什么样的广告"?
定向广告要素
第一步根据用户历史行为,选定一批用户的意图,并找到对应的广告。
第二步根据这些广告,进行排序。
三类角色
线下部分:竞价交易各参与者之间实现用户ID相互转换和对应,即Cookie Mapping。
线上部分:处理广告请求到来时的竞价和投放过程。
海量数据和存储
可运维性
数据管理平台DMP:Data Management Platform
DMP在4个阶段保证数据安全性