美团做为中国最大的在线本地生活服务平台,覆盖了餐饮、酒店、旅行、休闲娱乐、外卖配送等方方面面生活场景,链接了数亿用户和数百万商户。如何帮助本地商户开展在线营销,使得他们能快速有效地触达目标用户群体提高经营效率,是美团的核心问题之一,而机器学习相关技术在本地在线营销场景下发挥着很是关键做用。web
本文将从5个方面来介绍。首先,介绍O2O场景下广告业务的特色,及其与B2B和B2C广告业务的差异;其次,从商户效果感知、用户体验和媒体平台收益三个维度,介绍O2O广告业务的最重要的考量指标;第三,从前两节阐述的业务特色和考量指标出发,介绍O2O场景下在线广告营销的机制设计;第四,介绍O2O特有的实时场景化下的推送广告;最后,简要介绍O2O广告系统相关的工具。算法
在O2O业务模式和相关的平台崛起以前,大品牌的商家因为收入规模大、营销费用充分,为了提高品牌知名度依靠以下的途径开展宣传:传统媒体(如电视、广播、报纸);互联网流量(如传统搜索引擎、门户网站等);户外广告(如公交地铁车身、广告牌、灯箱等)。经过上述媒介,商户能快速接触大量的用户,宣传品牌的形象。上述营销方式也有其局限。首先广告投放的资金门槛较高,营销预算有限的商户没法承担相关费用;其次对于以直接效果为导向的商家来讲,上述投放形式过于粗放且没法造成直接的购买转化效果闭环。对于大多数的中小商家来讲,他们营销预算有限且更加注重直接的购买转化,获取潜在客户的主要途径是散发传单、派发礼物、沿街喇叭广告。可是,这些线下的营销手段覆盖到的潜在消费者较为有限,而且这些方式没法长期持续开展。服务器
以美团为表明的O2O本地生活服务平台快速成长壮大,逐渐成为广大本地服务商户在线营销的最重要的手段之一。美团平台上汇集了上亿的消费者,他们使用平台寻找商家、查询优惠信息、浏览评论。对于商户而言,他们是最直接的潜在消费者。经过在美团平台开展在线营销,商户可以得到更多的展现机会吸引更多客户到店消费。借助于便利的在线咨询、预约和支付手段,平台上的广告业务能够造成了效果闭环,商户能清晰准确掌握广告投放的效果并以此优化广告投放策略。网络
对于美团而言,平台能够基于对用户大数据的挖掘和分析,在由时间、地点、用户和关系构成的特定场景下,链接用户线上和线下行为,理解并判断用户情感、态度和需求,为用户提供实时、定向、创意的信息和内容服务。 O2O场景下的在线营销广告相较于传统的B2C和B2B商业模式下的广告有其独特属性,独特性主要体如今移动化、本地化、场景化以及多样性4个维度。架构
随着宽带无线接入技术和移动终端技术的飞速发展,人们逐渐开始使用手机等移动设备随时随地从互联网上获取信息和服务。在这个时代,不管是新闻阅读、社交通讯仍是电子购物,人们都习惯于经过手机应用来直接知足自身的需求。事实上,美团在移动互联网发展的初期就主动适应了这一历史潮流,大力发展移动服务能力,目前已经有超过90%的交易行为是经过移动互联网服务达成的。O2O广告做为链接人和服务的本地化生活服务营销模式,它有鲜明的移动化和本地化的特色。框架
移动化。它主要体如今精确性、即时性和互动性三个方面。经过移动设备的传感器,咱们能精确了解用户所处的地理位置,推送更加精准的广告。绝大多数用户随时都把手机带在身边,因此广告信息能及时推送给用户。功能强大的各类移动应用,为广告提供了多种互动可能性,例如在美团App上,用户直接能够完成推广商户的信息查询、排队和交易。机器学习
本地化。以转化效果为导向的O2O广告营销,营销的目标用户是提供服务的本地商户附近的人群。在淘宝上,一双皮鞋能够对全国的用户开展推广和售卖,不管消费者在何地,物流和快递都会准确地把货物送达到消费者的手上。而在美团上,一家在五道口的火锅店最佳的推广对象是五道口附近的食客,这些食客才最有可能直接到火锅店来消费。实际上,经过观测实际的交易数据,咱们发现超过90%的交易中用户和商户的距离小于3千米。营销活动要取得好的效果,必须针对性地选择目标群体,在O2O广告中目标群体就是本地化的用户人群。移动设备的精肯定位为商户发现目标人群提供了保证。ide
场景化。消费者、移动设备、时间、空间构成了用户消费需求的精准场景。PC时代,用户的标识以Cookie为载体,但Cookie极易清除,同时一台电脑可能会被多人使用,这致使用户信息很难有效串联,连受众年龄、居住地等基础信息都没法准确把握。而在移动互联网时代一机一人的模式下,经过分析和挖掘用户在平台上留下的各类行为足迹,咱们能对用户方方面面的属性和偏好进行解析和重构,产出十分精准的用户画像。在了解用户的地理位置、消费意图和行为轨迹等用户信息前提下,O2O广告营销能在由时间、地点、用户和需求构成的特定场景下,为用户提供实时、定向和富有创意的营销内容,链接用户线上和线下的行为。例如在一个阳光明媚的下午,对一个在CBD上班并有喝下午茶习惯的白领,平台能够适时地推送下午茶或者咖啡店商户。函数
多样性。O2O商业模式面对的是各式各样的本地生活服务业务,不一样的业务有着不一样的特色,并对O2O广告营销也提出了不一样的需求。举个简单的例子,不一样的服务业务对目标用户的本地性要求也截然不同:餐饮类服务对距离比较敏感,这一类服务商家的目标用户群体是商户周边的食客;婚纱摄影类服务对距离就没那么敏感了,这一类服务商家的目标群体是全城的新婚夫妇。工具
广告系统和搜索系统、推荐系统,有着十分类似的系统架构:它们大都采用了检索加排序的流程体系。基于这一点,有不少人认为广告业务和搜索推荐业务没有区别。实际上,广告业务有其独特规律。广告首先是一项商业活动,它的出现远远早于互联网。做为一种商业活动,商户、消费者和媒体平台三者的利益都要被重视和考虑,这些利益指标是广告业务得以可持续健康发展的启明灯。本节将从商业活动的角度出发,分析美团O2O广告营销中的商户效果感知、用户体验和平台收益这三项重要指标。
商户在美团广告平台上进行广告营销的根本目的,是经过美团触达更多的潜在消费者,得到最大的增量利益。 本地生活服务类型的商家的成本能够分为两个部分:变更成本和固定成本。变更成本是随着业务量变更而线性变更的成本,主要来自原料消耗。而固定成本是在必定时期内是不会随着业务量的改变而改变的成本,如门面装修的投入、店铺的租金、店铺服务人员的基本工资等。商户若是没有足够的业务量,不能招揽足够多的消费者,则单位业务量的成本会居高不下,致使严重亏损。所以,对于餐饮行业,商家的首要目标是提高翻桌率、减少空座率,而对于酒店行业,商家的首要目标是提高满房率、减小空房状况。固定成本的存在是本地商户开展O2O广告营销的基本前提。
从商户的角度出发,O2O广告营销的效果能够从三个维度来衡量:广告的可见性、广告带来的线上增量收益和广告带来的总体增量收益。
对于商户来讲,可见性是最初步且最直接的营销结果,是商户获得的最快的效果反馈。广告的可见性表示商户的营销信息已经开始经过媒体平台去触达潜在的消费群体。所以,稳定可靠的广告展示预期是赢得广大商户对O2O广告营销信任的最基础要求。
广告带来的线上增量收益是指经过在美团等媒体平台上的广告投放带来的线上收益。这一部分收益能够分为两类:一类是直接的在线订单带来的收入,例如团购、酒店预订等;另外一类则是在线预定等非直接交易带来的收益。对这一部分收益,平台方能给出准确的统计、分析并反馈给广告商户。对于外卖、婚纱摄影和酒店旅游等对线上流量、线上交易依附度很高的行业来讲,它们的线上收益占总体收益的比例很是大,这个比例直接反映了商户的经营活动的情况。
除了直接使用在线交易,用户使用美团的另外一种场景是经过平台查看商户菜品、评价和地理位置等信息,而后直接到店进行消费。广告给商户带来的总体增量收益即包含了这部分离线客户引流带来的收益。餐饮类的商户的线上交易只占门店总体收益的一小部分,所以,对广告效果的衡量须要综合考虑在线和离线两部分收益。离线引流部分收益相对于在线交易收益较难准确统计,可是平台能够经过用户的实时地理位置准确统计部分用户的到店状况,或者经过曝光、点击至到店的数据漏斗模型对到店数据进行估计。将来随着电子化支付方式的普及,平台将能更好地对商户的总体收益进行统计。
了解了O2O广告营销效果的主要衡量指标后,要肯定商户的广告投放成本是否真的较低,须要用到投入产出比(Return over Investment,ROI)这一经常使用的评价指标,即某次广告活动的总产出与总投入的比例。对应于两种广告收益指标,ROI也能够分为在线支付ROI和总体ROI:在线支付ROI等于在线增量交易额除以广告费消耗,总体支付ROI等于总体门店收入增量除以广告费消耗。在广告费预算有限的状况下,商户老是寻求优化广告投放,提高ROI。
有效地保障用户体验,是美团开展O2O广告营销的基本前提条件。平台只有保障用户体验、对用户有用,它的价值才能获得体现。美团经过让更多的用户留存并活跃在平台上,才能吸引更多的本地生活服务商户来进行广告投放,才能生成更大的流量用以广告变现。
美团主要从短时间和长期两个维度来进行用户体验指标的设计和度量。从信息曝光、用户点击和用户交易这个用户行为漏斗出发,短时间用户体验指标主要考虑了点击和交易状况。第一个短时间用户体验指标是点击率(Click through Rate,CTR),其数学表达为点击次数(Click)除以曝光次数(Impression)。点击率反映了给用户展现的商户信息的质量和相关性,与用户意向无关的、与用户所处时间地点场景不匹配的广告信息展现,不能知足用户的需求、吸引用户的点击,从而致使较低的点击率。点击率这一指标又细分为广告曝光的点击率和总体页面的点击率,前者度量了广告自己的优劣,后者反映了广告对总体信息呈现效果(天然结果加广告结果)的影响。劣质的广告除自身点击率较低以外,还会搅扰用户总体浏览行为,使得用户不能愉悦获取须要的本地生活服务信息。
为了得到真实的曝光,通常会在移动端进行埋点监控每一个POI在手机屏幕上实际展示的比例和时间,将超过必定展现比例和时间阈值的POI归入曝光次数的统计。
第二个短时间用户体验指标是转化率(Conversion Rate,CVR),其数学表达为交易次数(Order)除以点击次数(Click)。转化率一样反映了商户信息展现的相关性和质量,和用户需求不相匹配的商户展现将不能促成交易的达成,从而致使较低的转化率。和点击率指标相似,转化率指标亦可分为广告转化率和总体页面转化率。其中广告转化率还和商户的在线交易ROI成正比,准确有效的广告投放,不只能够提高用户体验,还能提高商户的ROI。
长期用户体验指标以更长的时间跨度为出发点,评价广告对用户的长期持续影响。长期用户体验指标主要包括回访率和复购率两个指标。回访率是一个反映用户长期留存的指标,其意义为必定时期内用户是否还会从新登陆和使用美团平台。回访率指标包括周回访率、月回访率等。低质量的广告投放,搅扰了用户使用平台方便获取商户信息的感觉和体验,使得用户脱离平台以至流失,从而致使回访率下降。复购率则反映了用户消费体验的指标,其意义是必定时期内用户是否会从新购买某一个商家的服务。一样,低质量的商户服务会损害了用户的消费体验,使得用户再也不进行一样的消费,进而致使了复购率的降低。
为了准确衡量广告投放带来的用户体验影响,除了进行策略变动对比测试以外,平台会长期保留一小部分流量做为对照组,不对这部分用户开展广告投放,经过比较总体流量和对照组上相关用户体验指标的差别,来肯定广告对用户体验的长期影响,进而督促和指导平台优化广告投放策略。
美团做为媒体平台的目标是,在保障商户ROI和用户体验的状况下,优化流量变现效率,实现商户营销诉求和用户消费诉求的最佳链接。
前两节已经介绍了商户ROI和用户体验的基本概念。咱们知道只有保障商户的ROI,才会有更多的商户、更多的预算进入到广告投放系统内;只有保障用户的体验,才会有更多的用户、更多的流量用于广告变现。这二者决定了广告业务这一块奶酪的大小。
流量变现效率衡量单位流量所能带来广告收益。对于展现广告业务,流量变现效率主要用千次广告展现收益(Revenue per Mille,RPM)来表示。对于搜索广告,流量变现效率主要用单次搜索广告收益(Revenue per Search,RPS)来表示。
从流量供给端来看,广告收入(Revenue)是广告曝光次数、点击率和点击单价(CPC)的乘积;从流量需求端来看,广告收入是广告主数量和每用户平均收入(Average Revenue Per User,ARPU)的乘积。在广告商户数、预算和流量状况稳定的前提条件下,流量变现效率的提升主要经过点击率和点击单价两个关键指标驱动,而这两个指标的良性提升依赖于广告投放的机制设计和投放算法,详细内容将在下文展开陈述。
前面介绍了美团O2O广告营销的特色,分析了商户、用户和平台三者的利益状况。本节将从上述特色和利益状况出发,阐述美团实际业务中O2O广告机制的设计原理,包括广告位设定、广告召回机制和广告排序机制。
在移动端,美团的天然结果以列表的样式进行信息呈现,而广告占用列表中的固定位置(区间浮动固定位置)进行展示。从商户的效果感知角度出发,固定位广告形式能给商户以较为肯定的广告展示预期,使得商户有明确的竞价标的(即固定展示位置)。
广告位的设定,须要综合考虑和平衡商户、用户和平台三者的利益关系。过于密集的广告位置设计和广告展示会下降用户寻找商户信息的效率,影响用户使用体验。过于稀疏的广告位置设计致使广告展示机会过少,致使平台流量变现效率能力不足。头部广告位对用户体验影响较大,可是能获取更多的曝光,更有价值,更能激发商户的出价意愿。腰尾部广告位对用户体验影响较小,可是广告位曝光几率小,不能有效刺激商户出价。美团的实际广告位设定,一方面考虑了各个展位和业务的自身特色,另外一方面经过A/B测试进行多种方案的比较和选择,最终选择能有效兼顾用户体验、商户效果和平台收入的设计方案。
广告召回在技术上与搜索和推荐十分类似。搜索场景广告会使用用户的查询词去广告商户索引中去寻找匹配的商户,推荐场景广告会根据用户的意图、位置等场景信息去匹配合适的商户。
搜索广告匹配中,一项重要技术是查询改写。一方面,咱们使用传统的天然语言处理方法,对查询进行有效分析(例如成分分析),完成同义和近义改写;另外一方面,咱们使用深度语义类似度神经网络模型(DSSM)和序列到序列模型(Sequence to Sequence)进行查询的改写,进一步提高广告匹配的覆盖率和准确性。
针对O2O商业模式的特色和广告业务各方的利益,广告召回机制在传统搜索推荐召回机制基础上进行了优化改进。咱们在召回中引入了逐层召回的理念,各层依次设置由紧到松的相关性水准(Match Level)控制召回广告的质量,在当前相关性水准已经召回足够数量广告候选的状况下,再也不进行后续召回。 相关性水准考虑多种相关性因素:查询匹配模式、距离和星级等。例如针对Query匹配模式,广告召回时会优先使用Query精确匹配模式召回,其次选择模糊匹配模式,最后才尝试采用语义匹配模式。针对距离因素,广告召回会优先召回距离3千米内的商户,其次选择5千米内的商户,最后尝试全城召回。
相关性水准的设置应该充分考虑到不一样O2O业务的特色。例如距离的设置上,对于餐饮类流量,系统会优先召回3千米内的商户,而对于距离相对不敏感的婚纱摄影类流量,系统则会放宽限制,优先召回10千米内的商户,或者直接采用全城召回策略。
和传统的搜索广告业务同样,美团的广告是按点击计费(Cost Per Click,CPC)广告,广告主依据广告的点击价值进行出价(bid),广告系统按照RankScore(RankScore为出价和广告质量度的乘积)进行广告排序。在广告系统中,广告质量度通常用广告的预估点击率来衡量。
广告按照RankScore排序后,会依据广义第二价格(Generalized Second Price)进行计费。
由此可知,准确的预测广告的点击率是保障广告收入和用户体验的前提。广告点击率预估问题是一个典型的监督机器学习问题,它的目标是在给定广告商户、用户和查询上下文的前提下准确预测点击行为发生的几率。这个监督学习问题的特征咱们用x表示,目标用y∈{1,-1}表示(广告曝光后得到点击为1,不然为-1)。经过收集线上的广告曝光和点击日志,咱们能够得到大量的标注样本{(𝑥i,𝑦i)}做为监督学习的训练数据。
咱们使用参数模型拟合这个几率:
其中,𝑤监督学习问题便是搜索𝑤使得目标损失函数最小的一个优化问题:
其中,𝐿(𝑦, 𝑓(𝑥, 𝑤))是模型的损失函数,在点击率预估问题中通常使用负Log似然函数(Negative Log-Likelihood)做为损失函数。优化问题(公式1)是原始的点击率预估问题,优化问题(公式2)引入了正则项𝑅(𝑤),用以控制模型的复杂度,防止模型过拟合。此外当咱们选择L1范数做为正则项的时候,咱们能得到稀疏解,缩减模型大小,进而减小线上服务加载模型的内存需求,提高模型的预测速度。下面咱们简要介绍几种经常使用的点击率预估模型。
逻辑回归模型
逻辑回归模型是普遍应用的点击率预估模型,它是一种线性模型,相应的优化问题有很是好的性质。它是一个无约束的凸优化问题,有全局惟一的最优解。它支持大规模的特征,经过经常使用的梯队方法能较快收敛到最优解。逻辑回归模型的可解释性十分优良,经过特征对应的权重咱们能很好分析各个特征的重要性以及它们对点击率的影响关系。
逻辑回归也有它的劣势:首先,做为线性模型,它的表达能力相对较弱,须要经过大量的特征工程工做(例如,特征组合)来弥补和提高模型的表达能力;其次,它须要进行大量的特征预处理工做,例如特征归一化、离散化等。
逻辑回归做为基础模型和其余模型相结合,扬长避短,充分发挥其做用。例如逻辑回归和梯度提高决策树结合,经过梯度提高决策树解决特征离散化和特征组合问题,并充分发挥逻辑回归对大规模特征的支持和良好的优化问题性质。
因子分解机FM模型和场感知因子分解机FFM模型
FM模型和FFM模型是非线性模型,它们对特征进行两两组合,提高了模型的表达能力。此外FM和FFM模型都对特征进行向量化的表达和学习(Wi,Wi,fj)提高模型的泛化能力。FFM相对于FM引入了域的概念,在FM中特征i和其余特征组合用的是同一个向量表示,而在FFM中特征i和不一样域的特征组合会使用不一样的向量表示,进一步提高了模型的复杂度和表达力。
人工神经网络(Artificial Neural Network,ANN)
近几年神经网络模型强势复兴,以深度神经网络为表明的方法,在图像识别、语音识别以及天然语言处理等领域超越传统浅模型,取得了突破性的进展。在点击率预估这个任务上,最近也涌现出一批深度神经网络模型,取得了明显的效果,其中典型的模型是Wide & Deep模型。
Wide & Deep模型包含Wide和Deep两个部分。Wide部分能够类比逻辑回归模型,能对相关特征的做用进行很好的记忆。Deep部分相似FM模型和FFM模型,它们都对相关特征进行了向量化的表示(Embedding)和学习,可是Deep部分经过复杂的网络结构能够表达更复杂的特征交互和组合关系,提供了更好的泛化能力和表达力。
梯度方法是模型的优化(优化问题的求解)的基础方法。公式3是使用标准梯度方法求解点击率预估优化问题公式1的迭代步骤。在点击率预估问题中,因为训练样本数量庞大(十亿、百亿),直接应用公式3计算量巨大,迭代速度受限。所以在点击率预估问题中,咱们通常使用随机梯度降低法(Stochastic Gradient Descent,SGD)进行问题求解。在SGD方法(公式4)中,咱们使用一小部分样本上的梯度对总体优化目标的梯度进行近似估计,加快参数迭代速度。其中b是样本集合大小,当b=1时,咱们用单样本的梯度来近似总体目标函数的梯度值。
在美团咱们使用参数服务器框架(Parameter Server)实现模型并行和数据并行,以解决包含大规模训练数据和特征的复杂模型求解问题,如图1所示:
特征工程方面,点击率预估特征主要从广告、用户和查询这三个方面来挖掘和刻画广告展示场景(见图2),特征须要包含影响点击率的方方面面,是模型成败的重要因素。特征的选取须要从业务场景出发。在O2O场景下,一个影响点击率的重要特征就是商户和用户之间的距离。
在O2O场景下,除了搜索推荐广告,推送广告也很是重要。推送广告就是媒体在合适的时机将合适的广告以消息的形式推送给合适的人群。推送广告的主要目标是:提高用户活跃度、实现人群精准触达。美团注册用户有3.5亿,可是日活跃用户只有3000万,年活跃用户也只有1亿,还有很大一部分用户平时不登陆美团App,或者登陆次数不多。给这部分用户推送广告,引导用户打开App,有助于提升用户活跃度。另外一方面,推送广告经过丰富的人群定向,实现精准投放。要实现精准触达,须要作到两点:有完整的用户画像,用户画像包含属性标签、偏好标签和行为标签,咱们以此来判断用户对广告的兴趣;智能匹配技术,将广告精准定位到合适的用户上。
推送广告的特色是:主动触达、用户意图不明确。理论上来讲,推送广告能够在任意时间给任意用户推送任意广告,而搜索广告只能在用户搜索或者筛选的时候给用户展现广告。但推送广告的劣势是用户意图不明确,而搜索广告具备搜索词或者明确的筛选条件,这些都是明确的用户意图。因此相比搜索广告,推送广告更须要精准的受众定向。
受众定向
经常使用的定向方式有下面几种:
时间定向。时间定向可以让品牌根据消费者行为、营业时间,甚至是季节性活动或特殊事件来进行广告投放。举个例子,美发沙龙只有白天营业,若是定向时间包括了晚上非营业时段,那么用户在晚上非营业时间看到广告后,没法经过打电话来预定,这样就没有转化。
重定向。它指根据用户的历史行为,将曾在商家发生过浏览、收藏、购买等行为的用户做为商家的精准定向人群,进行广告推送,拉回用户完成转化。一般状况下,消费者不会看过就能记住,你须要重定向。根据重定向推送广告是经过视觉方式提醒消费者有关商家产品信息的好方式。消费者看到后可能会想:“啊,我忘了要买这双鞋……”而这种面包屑式的提醒方式每每可以诱使他们点击并购买。重定向方式是全部定向方式中最精准、投资回报率最高的。
地理位置类定向。它指的是根据用户实时地理位置(通常是蜂窝信息或者GPS经纬度)作一些定向,有助于帮助商家触达那些正在前往商家所在区域的消费者,包括距离定向、商圈定向等。这种定向方式在移动设备上投放广告时有着很是重要的做用。好比本地的一家美发沙龙,想要招揽本地生意,那么就可使用地理位置定向技术在特定半径内进行宣传。若是这家店在三角区内有发廊的特许经营权,那么它就可使用该技术进行一个以上定位。固然针对各区域进行定向的时候,商家能够根据区域内业务发展情况调整出价。
人口属性定向。人口属性标签包括性别、年龄、收入水平、婚姻情况、是否有车、是否有小孩等。经过人口属性标签,能够将广告推送给相关消费者,就是可能购买的人群,具体选择什么标签主要取决于商家销售的是什么产品。例如婚纱摄影类商家会选择婚姻情况标签为“未婚”的人群进行广告投放,美甲美睫类商家会选择性别标签为“女性”的人群进行广告投放。这些标签里面,性别、年龄这种标签比较容易获得,由于用户注册的时候就提供了相关信息;而收入水平这种标签须要经过预估获得。使用人口属性定向的时候,标签既不能过于笼统,也不能太过细分。例如美甲美睫商家选择年龄标签的时候,一方面,不能选择0~60岁,这种人群太泛了,低年龄段和高年龄段人群可能没有很强烈的美甲美睫需求。另外一方面,也要防止对人群太过细分,例如,尽管最终可能须要选择一个更细化的年龄标签,但却不能仅仅定位为一个具体年龄,若只选择22岁的人群,这可能致使人群覆盖不完整。时刻记住目标受众,但在定位的时候得找到一个折中的办法。
行为定向。它是从用户的行为数据中挖掘用户兴趣偏好,从而推送相应的广告。行为数据包括频道、商家详情页、团单详情页的浏览和点击,用户评论和打分等。兴趣偏好通常分为长期、短时间和实时偏好。当咱们挖掘用户长期偏好的时候,使用的是“一段时间内的行为”,须要对不一样时间的行为计算不一样的权重,由于用户的兴趣是动态变化的,三个月前用户商圈偏好是A,可能如今搬家了商圈偏好变成了B。为了衡量不一样时间行为权重,将行为累计控制在一段时间内,通常使用滑动窗口法和时间衰减法。兴趣偏好包括品类偏好、价格偏好、商圈偏好等。品类偏好指的是用户偏好的商品和服务的品类,例如,用户喜欢吃川湘菜仍是江浙菜,喜欢火锅仍是自助餐;价格偏好指的是用户的消费水平,例如,用户点外卖价格区间是偏好0~20元价位仍是偏好20~40元价位。
新客推荐。即Look-alike,以广告主的老顾客做为种子信息,结合广告平台的大数据,寻找出老顾客具备的某种特征或规律,为广告主找到具备相同特征或规律的潜在顾客。这种方式可在保证精准定向效果的同时,扩大用户覆盖面。例如一个川菜馆广告主想投放广告,目标人群除了在本店消费过的顾客外,还能够选择在别的川菜馆或者湘菜馆消费过的顾客,由于他们可能口味差很少。
用户在平台上的搜索、浏览、收藏、购买等行为会被记录下来,造成用户日志。经过对用户日志的分析和挖掘获得用户画像,包括用户基本属性、兴趣偏好、行为标签等。广告定向是广告和用户匹配的过程,为每一个广告找到适合的受众群体。广告投放后,须要统计定向效果,包括定向精准程度和覆盖率。精准定向广告的运做流程如图3所示。
为了实现广告和用户的匹配,首先须要为广告的受众人群进行初步假设,即肯定广告感兴趣的人群,并将其与用户画像标签映射起来,这一步要靠产品调研和分析获得。而后根据这个初步假设肯定广告投放的定向条件,匹配到符合条件的人群。
在这样的表达形式中,有两点须要说明:第一,每一个DNF能够分解成一个或者多个合取范式(Conjunction Normal Form,CNF),DNF1 = C1∪ C2,其中,C1 =(30岁 男性), C2 =(25岁 女性);第二,每一个CNF能够分解成一个或者多个条件的交。上例中的C1 = A1 ∩ A2,其中A1 = 30岁,A2 =男性。
在美团推送广告中,重定向方式点击率和转化率最好,但覆盖率最低;地理位置定向和人口属性标签拥有更普遍的人群,效果相对较差。实际采用哪一种定向,须要看广告主的推广需求,广告主须要综合考虑精准程度和覆盖率的平衡。
“工欲善其事必先利其器”,有效的工具是一个优秀高效的广告生态的重要组成部分。本节咱们从面向开发人员、面向广告主和运营人员两个角度进行简述。
面向开发者的工具主要包含三个方面:离线数据分析工具、实时数据分析工具以及在线广告系统调试工具。
离线数据分析工具支持从各个维度(广告位、广告类型、时间、区域、算法策略等)统计广告业务的各项关键指标(召回率、点击率、转化率、RPS/RPM、CPC等),检视广告系统的短板和漏洞,帮助广告算法和工程团队发现问题和寻找潜力。
实时数据分析工具从时效性角度弥补离线数据分析的缺点,帮助开发者尽早发现数据异常,更快地响应和修复问题。在背后支撑这些分析方法的是Hive、Spark、Elasticsearch和Druid等大数据处理工具。如图5所示是实时消耗数据分析工具。
在线广告系统调试工具是针对单个广告主或单个查询等具体问题的排查。经过调试工具可方便构造模拟请求并查看单个服务处理详细信息,收集各个广告流程步骤(召回、排序和创意优选等)的信息,跟踪和定位线上实时环境中各步骤的问题。除了线上问题排查以外,调试工具也是开发阶段用于验证策略效果和算法正确性不可或缺的手段。如图6所示是在线广告调试工具的基本界面。
面向广告主和运营人员的工具包括广告主出价预估和排名预估、商户效果漏斗分析、帐户诊断等相关工具。面向广告主的工具帮助广告主更好地衡量和感知广告效果,让其了解市场竞争状况,协助其有效主动地优化广告投放效果。面向运营人员的工具能让运营人员对广告主的投放状况有更清晰的了解,进而帮助其更好地指导和服务广告主。
1. 效果漏斗分析工具
如前文所述,O2O广告从在线展现到用户进店消费须要通过点击和转化多个流程,为了帮助广告主优化总体投放效果,咱们在推广后台提供了效果漏斗分析工具。效果漏斗分析工具主要包括曝光/访问量/感兴趣/到店三层漏斗,同时给出相应的问题诊断和优化建议,如图7所示:
2. 推广实况工具
感知广告展现位置以及竞价实况是投放中的广告主核心需求之一。但个性化智能排序技术体系和带有地理位置限制属性的O2O广告场景下,因为用户个性标签、地理位置等缘由会致使广告主看不到本身投放中的广告在客户端曝光,广告主难以分析缘由,也不知道如何优化现有的广告投放。
推广实况工具提供查看排名、模拟出价和诊断优化功能。广告主能够查看选定商圈、类目、地理位置等特定条件下的实时排名,也能够查看去个性化后通常状况下的平均排名。同时工具对于广告展示位次太低或得不到展现的状况会给出具体的缘由和相应提示。广告主可根据提示调整投放设置,好比对出价太低致使排名靠后状况建议调高出价,经过工具能够实时查看调整后的新排名状况,如图8所示:
3. 流失订单分析工具
流失订单分析工具基于门店流失订单记录提供对比分析功能。流失订单是指最近一周内用户对商家A进行了点击,但实际去B、C商家下单的流量算做A的流失订单。分析工具根据用户的点击下单行为数据帮商家分析自身与用户最终下单商家之间的差距在哪里。好比对酒店商家,工具会提供商家平均房价、平均评分、商家首图等信息对比,广告主从中能够分析出订单流失缘由,如图9所示:
4. 广告收益模拟器
为吸引潜在新广告客户入驻,广告收益模拟器为商家提供广告收益预估功能。该工具基于门店的历史非广告时期点击转化率、门店所在商圈流量以及竞争对手状态等信息,预估门店投放广告后可以带来的新增流量和订单量,帮助新客户快速了解广告产品,创建投资回报预期。同时经过该工具,商户能够方便地跳转到推广通平台进行注册和投放。此外,模拟器也可协助销售人员对商圈流量以及商圈可承载广告数进行预估,让销售人员更有针对性地开拓市场,提高新签成功率,如图10所示:
本章从O2O广告的特性出发,介绍了O2O广告利益相关方的主要关注指标。O2O广告是美团的核心问题之一。本章着重介绍了如何应用机器学习方法提高广告投放的效果和效率,以及本地场景化的推送广告。此外,还简要展现了O2O广告平台相关的工具。
亦平,2013年6月加入美团,目前负责美团搜索广告算法策略,曾负责美团搜索排序工做。
美团广告平台全面负责美团到店餐饮、到店综合(结婚、丽人、休闲娱乐、学习培训、亲子、家装)、酒店旅游的商业变现。搜索广告基于数亿用户、数百万商家和数千万订单的真实数据作挖掘,在变现的同时确保用户体验和商家利益。欢迎有意向的同窗加入搜索广告算法组。简历请投递至:zhouyayue#meituan.com
[1] Huang, P.-S., He, X., Gao, J., Deng, L., Acero, A., & Heck, L. (2013). Learning deep structured semantic models for web search using clickthrough data. In Proceedings of the 22nd ACM international conference on Conference on information & knowledge management (pp. 2333-2338). [2] Sutskever, I., Vinyals, O., & Le, Q. V. (2014). Sequence to sequence learning with neural networks. In Advances in neural information processing systems (pp. 3104-3112). [3] Juan, Y., Zhuang, Y., Chin, W.-S., & Lin, C.-J. (2016). Field-aware Factorization Machines for CTR Prediction. In Proceedings of the 10th ACM Conference on Recommender Systems (pp. 43-50). [4] Cheng, H.-T., Koc, L., Harmsen, J., Shaked, T., Chandra, T., Aradhye, H., . others. (2016). Wide & deep learning for recommender systems. In Proceedings of the 1st Workshop on Deep Learning for Recommender Systems (pp. 7-10). [5] Li, M., Zhou, L., Yang, Z., Li, A., Xia, F., Andersen, D. G., & Smola, A. (2013). Parameter server for distributed machine learning. In Big Learning NIPS Workshop (Vol. 1). [6] Edelman, B., Ostrovsky, M., & Schwarz, M. (2005). Internet advertising and the generalized second price auction: Selling billions of dollars worth of keywords.