SEM翻译过来叫搜索引擎营销,我的认为是随着搜索引擎竞价排名出现的一个行业,已经有了好多年的历史,作sem的公司这些年里手里应该都积攒着大量的cookie,关键词等与SEM和追踪相关的数据,这些数据如今更可能是用来给用户报表使用的,但其实我的认为这些数据经过RTB便可以变现又能够为广告主提供更好的解决方案,只不过如今好多SEM公司没有找办挖掘的办法而已.redis
DSP(需求方平台)是随着RTB(实时竞价)而兴起的一个产业,这个东西的规则就是当一个用户访问了一个网页,这个网页上有些广告位是给了RTB的,则rtb会将这个用户的ID和广告位等信息下发到在它这注册的DSP们,而DSP须要在一段时间内(一般是100ms)返回竞价信息和广告信息,而后由rtb根据本身的竞价规则(一般是出价最高的那个)来进行展现.sql
这二个东西我的感受有很强的互补性.缘由有如下几点:mongodb
1.dsp能够为sem公司增长了收入来源:sem是严重依附于PC端的搜索引擎流量的,在国内基本能够说是严重依附着百度PC端的流量的,而随着互联网用户的注意力往移动端的转移,搜索的统治力和PC端的流量的增加会放缓,甚至是见顶,这时搜索引擎的ROI应该就没那么有吸引力了,同时各个SEM公司之间也会陷入到刀刀见血的价格战里,而DSP却能够给sem公司另外一个收入来源.cookie
2.DSP能够对sem的历史数据进行有效的变现:DSP我的认为算是一个大数据时代的产物,是严重依赖于用户的历史行为数据的,而sem通常又有大量的用户行为数据(通常cookie都是亿级的).同时数据的质量也还不错(通常都会有用户的quey信息,用户的url信息以及用户在广告主那的追踪信息),只要在dsp这作好cookie mapping, 哪怕只是经过简单的url重定向和query重定向这种匹配方式,应该也能得到不错的ctr和cpc.app
3.dsp能够为广告主提供更个性化的定制:由于竞价排名的核心规则是搜索引擎本身定的,因此sem应该是很难为广告主提供一些更深刻,更个性化的解决方案的.好比苏宁须要把本身的广告展示给京东的用户看或者苏宁的母婴频道要对老客户作优惠活动,须要把这个信息传送给他的老客户,这些须要应该是sem所很难作到的,但DSP能够作到这些.运维
4.DSP能够补充搜索广告过重效果的问题:搜索广告过重效果,致使对某些偏展现性的需求知足的并很差(有人说百度有网盟,但网盟与其说是用来补充搜索广告不足的.倒不如说是用来快速消耗广告主未花了的bugdet的.我有个朋友开陪训的,用百度投的广告,基本反应就是网盟花钱根本就没数,并且效果也没看到有多好,相反搜索的广告效果还不错)机器学习
5.DSP和SEM是互动的:即若是有一个新的广告主,可让其先作SEM,一来能够经过SEM来完成一部分种子数据的累积,二来能够在这段时间来作好与广告主的COOKIE MAPPING,来近能够的盘活广告主这边的数据。nosql
技术的实现:分布式
这里就简单说几句,我的比较认同品友互动的观点,即DSP须要有RTB能力和数据挖掘能力,学习
rtb能力:一方面是系统的构建能力,建议多用用nosql的技术(redis,mongodb),同时必定要作好cookiemapping,这样才可能让每一个用户的信息都是独立的,不依赖于其它用户的,另外一方面是RTB的流量预测和分配了,预测问题初期建议多分析分析日志,简单的count应该就成.分配问题建议参考一下以前转的合约广告的文章,离线算出一个server rank,而后根据server rank来分配流量
数据挖掘的能力:一方面是大规模分布式平台的搭建和运维能力(基本等于同于大规模离线存储,MR,MPI)这个算是进行大规模机器学习的基础.另外一方向就是机器学习的能力了,若是公司初期没有好的人,建议受从定向这块就好好弄弄query重定向和url重定向,看看效果再说.若是团队不错,则能够经过为每位广告主训练一个用户的二元分类器,来帮助广告主完成上面所说的更深刻更个性的需求,至于算是通用的ctr预估(用逻辑回归来作的)和网页上下文分析(用topic moudle来作),能作就作,作不了就先拿些简单的方案来替代吧