转于:http://www.damndigital.com/archives/58893php
第一方Cookie和第三方Cookiehtml
大多数的第三方监测工具和网站分析工具都会采用第三方Cookie。所谓第一方和第三方的说法,是用来肯定Cookie的归属的,这个归属是指 Cookie中记录的域(domain)。第一方和第三方的惟一区别只是:Cookie中的域名是否和被访问网站的域同样,是就是第一方,否就是第三方。 举个例子:若是你访问网站www.chinawebanalytics.cn的时候,网站在你的电脑上设置了一个Cookie,里面的记录的域名也是 www.chinawebanalytics.cn,那么这个Cookie就是第一方的,归你访问的网站 www.chinawebanalytics.cn全部。而若是你访问网站www.chinawebanalytics.cn时,在你的计算机中设置的 Cookie的域名是www.abc.com,那么这个Cookie就是第三方Cookie,归www.abc.com全部。linux
因此,第一方Cookie并不必定须要由某个网站本身的服务器给本身创建,别的网站也能为它创建;并且,第一方Cookie也不必定是能由某个网站本身读取的,它彻底可能由第三方读取。(以上内容和例子来自于捍卫Cookie——没有Cookie,咱们什么都没有了)android
一、语言的来源git
简单理解,语言指的是用户的浏览器语言,是从浏览器的Http Header的Accept-Language的字段来的。web
二、浏览器的Accept-Language是由浏览器的语言设置所决定的。chrome
三、浏览器的默认语言设置和浏览器语言无关,默认继承操做系统的语言。数据库
浏览器定向一样须要依赖于各个浏览器在打开页面时所传输的Http header信息中的User-Agent,关于User-Agent的说明,请参见Http header之User-Agent。
User-Agent的详细信息,请参见浏览器User-Agent的详细信息。apache
咱们来了解User-Agent中浏览器及版本识别的方法:跨域
1、浏览器的使用率说明:
咱们针对以上的浏览器进行说明,另外再针对移动设备上的几款浏览器进行说明。
2、浏览器识别
一、IE浏览器(以IE 9.0 为例)
PC端:User-Agent:Mozilla/5.0 (compatible; MSIE 9.0; Windows NT 6.1; Trident/5.0;
移动设备:User-Agent: Mozilla/5.0 (compatible; MSIE 9.0; Windows Phone OS 7.5; Trident/5.0; IEMobile/9.0; HTC; Titan)
因为遨游、世界之窗、360浏览器、腾讯浏览器以及搜狗浏览器、Avant、Green Browser均采用IE的内核,所以IE浏览器判断的标准是”MSIE“字段,MSIE字段后面的数字为版本号,但同时还须要判断不包 含”Maxthon“、”The world“、”360SE“、”TencentTraveler“、”SE“、”Avant“等字段(Green Browser没有明显标识)。移动设备还须要判断IEMobile+版本号。
二、360浏览器
PC端:User-Agent: Mozilla/4.0 (compatible; MSIE 7.0; Windows NT 5.1; Trident/4.0; InfoPath.2; .NET4.0C; .NET4.0E; .NET CLR 2.0.50727; 360SE)
移动设备:暂无
360浏览器的判断标准是”360SE”字段,没有版本表示。
三、搜狗浏览器
PC端:User-Agent:Mozilla/4.0 (compatible; MSIE 7.0; Windows NT 5.1; Trident/4.0; SE 2.X MetaSr 1.0; SE 2.X MetaSr 1.0; .NET CLR 2.0.50727; SE 2.X MetaSr 1.0)
移动设备:暂无
搜狗浏览器的判断标准是”SE“、”MetaSr“字段,版本号为SE后面的数字。
四、Chrome
PC端:Mozilla/5.0 (Macintosh; Intel Mac OS X 10_7_0) AppleWebKit/535.11 (KHTML, like Gecko) Chrome/17.0.963.56 Safari/535.11
移动设备:User-Agent: Mozilla/5.0 (Linux; U; Android 2.2.1; zh-cn; HTC_Wildfire_A3333 Build/FRG83D) AppleWebKit/533.1 (KHTML, like Gecko) Version/4.0 Mobile Safari/533.1
PC端chrome浏览器的判断标准是chrome字段,chrome后面的数字为版本号;移动端的chrome浏览器判断”android“、”linux“、”mobile safari“等字段,version后面的数字为版本号。
五、Safari
PC端:User-Agent:Mozilla/5.0 (Macintosh; U; Intel Mac OS X 10_6_8; en-us) AppleWebKit/534.50 (KHTML, like Gecko) Version/5.1 Safari/534.50
移动设备:User-Agent:Mozilla/5.0 (iPhone; U; CPU iPhone OS 4_3_3 like Mac OS X; en-us) AppleWebKit/533.17.9 (KHTML, like Gecko) Version/5.0.2 Mobile/8J2 Safari/6533.18.5
因为Chrome及Nokia’s Series 60 browser也使用WebKit内核,所以Safari浏览器的判断必须是:包含safari字段,同时不包含chrome等信息,肯定 后”version/“后面的数字即为版本号。在以上条件下包含Mobile字段的即为移动设备上的Safari浏览器。
六、腾讯浏览器
PC端:User-Agent: Mozilla/4.0 (compatible; MSIE 7.0; Windows NT 5.1; Trident/4.0; TencentTraveler 4.0; .NET CLR 2.0.50727)
移动设备:User-Agent: MQQBrowser/26 Mozilla/5.0 (Linux; U; Android 2.3.7; zh-cn; MB200 Build/GRJ22; CyanogenMod-7) AppleWebKit/533.1 (KHTML, like Gecko) Version/4.0 Mobile Safari/533.1
腾讯浏览器的判断标准是”TencentTraveler“或者”QQBrowser“,TencentTraveler或QQBrowser后面的数字为版本号。
七、Firefox
PC端:User-Agent:Mozilla/5.0 (Windows NT 6.1; rv:2.0.1) Gecko/20100101 Firefox/4.0.1
移动设备:User-Agent: Mozilla/5.0 (Androdi; Linux armv7l; rv:5.0) Gecko/ Firefox/5.0 fennec/5.0
Firefox的判断标准是Firefox字段,firefox后面的数字为版本号。
八、The world
PC端:User-Agent: Mozilla/4.0 (compatible; MSIE 7.0; Windows NT 5.1; The World)
移动设备:暂无
Theworld浏览器的判断标准是”The world“字段,没有标示版本号。
须要注意的是:The world 2.x版本的User-Agent中没有”The world“的字段。
九、遨游
PC端:User-Agent: Mozilla/4.0 (compatible; MSIE 7.0; Windows NT 5.1; Maxthon 2.0)
移动设备:暂无
遨游浏览器的判断标准是”Maxthon“,Maxthon后面的数字为版本号。
十、Opera
PC端:User-Agent:Opera/9.80 (Windows NT 6.1; U; en) Presto/2.8.131 Version/11.11
移动设备:User-Agent: Opera/9.80 (Android 2.3.4; Linux; Opera mobi/adr-1107051709; U; zh-cn) Presto/2.8.149 Version/11.10
opera浏览器的判断标准是opera字段,opera字段后面的数字为版本号。
十一、UC浏览器
UC Web有多种模式浏览方式,对应的User-Agent为:
UC无
User-Agent: UCWEB7.0.2.37/28/999
UC标准
User-Agent: NOKIA5700/ UCWEB7.0.2.37/28/999
UCOpenwave
User-Agent: Openwave/ UCWEB7.0.2.37/28/999
UC Opera
User-Agent: Mozilla/4.0 (compatible; MSIE 6.0; ) Opera/UCWEB7.0.2.37/28/999
UC浏览器的判断标准是”UCWEB“字段,UCWEB后面的数字为版本号。
操做系统定向依赖于各个浏览器在打开页面时所传输的http header信息中的User-Agent,关于User-Agent的说明,请参见Http header之User-Agent。
User-Agent的详细信息,请参见浏览器User-Agent的详细信息。
咱们来了解User-Agent中的不一样操做系统的识别方法。
PC端:
移动设备端:
地域定向依赖于对IP地址的识别,而IP协议是互联网的基础协议,所以从网络诞生的第一天起,地域定向就能够被使用了。
欲详细了解IP协议,请查看百度百科——TCP/IP协议。有关IP地址的详细信息,请查看百度百科——IP。
通俗来说,IP地址就是互联网上的门牌号,接入互联网的全部主机就是咱们的一个个住所,其中有我的的,有单位的。我的住所一家一个 门牌号,单位的多家公用一个门牌号,因为规划的缘由,有的住所会有多个门牌号,也是规划的缘由,门牌号有时会发生变化。IP地址也有此特色,一台主机能够 具备多个IP地址,而多台主机也能够公用一个IP地址。
现实中,无论如何规划,经过门牌号咱们能找到咱们要找的住所,也能清楚住所所在的具体位置。一样,在网络中,经过IP地址咱们也能定位到咱们所须要找的主机,而且清楚知道主机所在的地理位置。这样咱们就能进行广告的地域定向了。
从技术层面讲,地域定向的工做逻辑是:
当一个请求发送给服务器时,服务器根据配置(以Apache为例,在Apache Httpd中进行配置)记录下请求的相关数据,组成日志文件,日志基本会包括请求时间、请求IP、请求的URL、请求的Reffer、请求的User-Agent以及其余信息,将收集到的IP地址与已有的IP数据库进行比对,便可以肯定请求者的地理位置了,好比山西省太原市。
国内目前免费的IP库有 QQ IP数据库 纯真版,即咱们一般所说的纯真IP库,收集了包括中国电信、中国网通、长城宽带、网通宽带、聚友宽带等 ISP 的最新准确 IP 地址数据,包括最全的网吧数据。IP数据库每5天更新一次,企业能够在此基础上修正后使用。
目前的地域定向更多的是针对省份以及地级城市的定向,针对县级市或者区级的定向基本上都十分不许确。
随着电商网站的火爆,从2010年开始,互联网广告行业出现了一种定向方式——回头客定向。回头客定向是随着精准理念的发展而提出来的。顾名思义,回头客定向是指针对到达过广告主网站的某一个点的用户或者发生过某一个行为的用户进行定向。
从概念中,咱们能够发现回头客定向的三个基本点:一、到达过;二、某一个点或某个行为;三、定向投放。这三点也是回头客定向和人群定向的区别之处。
从营销的角度讲,针对不一样到达深度的用户或者不一样行为的用户,咱们须要采起的营销策略可能会有不一样。咱们以电商网站的购物流程来举例子。电商网站的购物流程分为如下几个步骤:
一、针对浏览过商品的人,咱们应该分析他的浏览记录,发现他感兴趣的商品,而后经过广告将他感兴趣的商品推送到他的面前(若是要作到很是完美,针对每一个用户有不一样的广告显示,须要有哪些条件?你们能够评论,咱们一块儿交流)。
二、针对已经将商品加入购物车的人,此时可能更重要的是给他一张电子优惠券,以促进其下单。
三、针对到达过注册或者登陆界面,但未完成注册和登陆的人,给他一个商品即将售馨或者即将涨价的倒计时更能促进其回来下单。
四、针对到过填写配送地址页面但没有提交订单的人,提示免邮递费用或者直接告诉他“你还差一步就将完成订单”,可能会是一个好的方法。
五、已经提交订单的人,是咱们的老客户了,此时应该推荐关联的商品信息,以促进其二次消费。
因此,进行回头客定向的投放,必定是要有如下三个步骤的:
一、设置回头客人群的监测。支持回头客定向的系统必须可以支持对各个点的监测,所以提取监测代码在此是必须的。好的系统能够利用一个监测代码,经过数据分析得出不一样监测点的回头客(你们说如何作到?);差的系统就提供不一样监测点的设置功能,每一个监测点提取不一样的监测代码。
二、整理针对各个监测点用户的独特营销诉求。制做针对不一样回头客的不一样创意。
三、利用投放系统,对回头客进行定向的广告投放。
通常来说,定向越准确,能获得的量就会越少,所以,在作回头客定向时,不该该再选择媒体进行投放。从另外一个角度理解,回头客定向已是最领先精准的目标用户定向了,此时媒介选择的意义也大大弱化了。
以上所说的是纯正意义上的回头客定向,鉴于回头客定向受人欢迎的精准的概念和可怜的流量,有些人或公司权衡后会将回头客定义的很是普遍,好比到过网 站的人、点过广告的人、看过广告的人都算做回头客,这只是又一次的中国特点而已。这种事情多了,反而于精准广告市场的发展不利。
人群定向其实就是目标人群定向,在营销学中,产品定位以及人群细分是很是重要的理念,这种理念也已经获得了市场的承认,所以每一种产品在设计、生产 之初就已经肯定了本身的目标人群。从咱们的广告投放、市场宣传来说,必定是但愿能给对目标人群进行,花费在目标人群以外的推广都是浪费的。
但在以往的媒介中,想要彻底的识别用户,以肯定是否目标人群并非容易的事情,甚至从理论上说是彻底作不到的,只能经过不一样的媒介手段去尽可能的靠近 目标人群(电视、广播、杂志都是如何肯定本身的受众的呢?有人讨论嘛?)。但即便这样,也产生了一句广告界最著名的话语——我知道广告费浪费了一半,但我 不知道究竟是哪一半。
在互联网时代,经过技术的力量,能够无限的接近、近乎准确的判断每个人的属性,从而为广告主目标群体定向服务。可是,互联网也只是无限的接近,而 不是确切的能标示出我的的属性。目前,最接近的应该是相似于罗维邓白氏之类公司的数据 (顺便说一句,央视315晚会的曝光,对罗维邓白氏公司只能是免费的广告,而不是打击)。
言归正传,咱们来讲说互联网的人群定向。互联网公司一般讲的人群定向并不仅仅包括人口的天然属性(demographic),还包括人群兴趣(interest)、人群行为(behavior)、购物行为(purchasing)。
对于真正提供定向的公司,无论各个公司都提供什么样的人群定向,以上所说的4类属性或行为都是基于cookies技术(了解Cookie),经过对用户长期的互联网浏览行为数据进行分析所得出的。因为各公司的资源优点不一样,所以目前没有一个公司可以创建健全的数据。
天然属性(demographic)
天然属性包括性别、年龄、学历、地域、婚姻情况、家庭情况(是否有小孩,小孩年龄等)、收入(我的收入、家庭收入)、行业、职业等信息。单纯经过互 联网浏览行为并不能分析到如此全面且准确的信息,目前还主要以找到真实的样本进行建模分析为主。天然属性数据以艾瑞的数据最为准确。
人群兴趣(interest)
人群兴趣在每一个公司会有不一样的认知。目前,兴趣数据属悠易最好,悠易的数据是公开的,能够经过悠易受众引擎查看。
人群行为(behavior)
上面注解所说的人群行为仅仅是行为中的一种,若是有搜索引擎的资源,则能够加入搜索行为的监测(如百度的搜客定向——对在百度搜索过已添加关键词的 人,在其浏览指定的投放网站时投放客户推广组下的创意。);若是有微博数据,则能够加入关注与被关注的行为(新浪有此打算吗?),所以人群行为各公司的定 义差别是最大的。
购物行为(purchasing)
购物行为指的是做为消费者角色,互联网用户的消费数据。毋庸置疑,购物数据若是淘宝是第二,也没人能够自称第一。
在广告系统中,用户的全部属性或行为应该是能够进行自由组合设定的。但以上全部的属性或行为就能够全方面的了解用户了吗?并非!这是一个发散性的 命题,每一个人会有不一样的看法。好比咱们还能够加入用户的设备(PC、Pad、移动设备等),经过用户上网通道来描述用户。还有其余的角度吗,你们留言讨论 吧!
在按天售卖或者按时间售卖的时代,是不须要考虑并发次数的。只是在按照展示次数(CPM)售卖的时候,咱们才有可能须要考虑广告并发的设置。
在按照CPM(何为CPM) 售卖时,广告投放的速度能够有两种——尽快投放和匀速投放。尽快投放很好理解,就是尽快投放完规定的量。匀速投放就是在规定的时间内均匀的投放完规定的 量。举个例子,一天以内投放1000个CPM,选择尽快投放就意味着广告在第x小时投放完毕,那么(24-x)的时间内就不会再看到广告;而匀速投放意味 着咱们须要在第23小时59分时还看到广告。这个如何作到呢?此时就须要利用并发次数的设定了。
并发次数指的是广告某个时间周期内播放的次数,其目的是为了保证广告的匀速投放。并发次数的计算方法为:广告投放量/投放时长。注意:此处的时长根 据须要,能够按照秒、分、刻等单位来计算。并发次数的规则须要广告投放核心的支持,当在规定的时长内,广告未达到并发次数时,广告能够展示。达到设置次数 后,则不予以展示。
一个思考题:若是一个广告一天内要求投放1000CPM,而媒体的PV一天正好是1000CPM,那么尽快投放是否可以跑完广告的规定量?匀速投放是否可以跑完广告规定的量?若是跑不完,咱们须要怎么作,才能够跑完?
每个广告活动,每一次宣传活动,都会有周期的设定。在一个投放活动被制订出来后,在每种媒介、每一个媒体上的投放周期就已经肯定了。电视、广播、报 纸杂志是以节目的播放时间、广告顺序以及报刊杂志的期数来决定投放的周期的。互联网广告则以开始日期、结束日期以及投放时段来决定投放周期的(须要注意的 是:投放时间是以服务器的时间为准的)。
说明:互联网的时间使用的是UTC时间体系,北京时间=UTC+8。(关于UTC时间和GMT时间以及北京时间的关系)
问题:在广告系统设计时,怎样设计可使用户方便快捷的设置天天不一样的投放时段?
网页定向指的是针对特定的URL进行定向,使广告投放在指定的URL上。网页定向是互联网广告定向中不常使用的定向。
网页定向最核心的技术有两个:
一、如何获取当前页的URL,注意是当前页非Http Header中的Reffer。当前页URL须要经过加在页面上的JS代码得到,设计时须要考虑到若是JS代码被放在iFrame中的状况,甚至会被放置 到好几层嵌套的iFrame上(这样放置代码的媒体更多为了做弊,能够参见在线广告做弊手段一览【见下】)。
二、广告系统在定向设置时须要考虑到URL匹配问题。左匹配、右匹配、包含、不包含、通配符等。匹配规则须要在广告投放核心进行处理。
频次是广告投放中一个很是重要的概念。网络广告的频次和其余媒介投放时的频次概念是一致的。
频次是指我的或家庭接触广告信息的次数。在传统的电视媒介中,咱们不能准确的控制每个人接触广告信息的次数,只能是经过总收视点除以到达率计算得出。可是在网络广告中,一我的能够接触广告信息的最高频次是能够严格控制的,实现严格控制的基础技术也是cookie,可见cookie对于互联网广告精准投放的重要性。
在网络广告的投放中,频次的控制对象比其余媒介更普遍,频次能够控制广告的浏览、点击、完整浏览,甚至是广告的转发、下载等其余的行为,所以互联网 的频次指的是访客与广告发生互动的最高次数,而互动的行为设定则须要可以在广告系统中进行设置。固然常常仍是对广告的浏览进行频次设置,咱们也以此举例。
网络广告频次控制的原理很是简单。当用户经过浏览器访问页面时,会请求放置在页面的广告位代码,广告位代码和服务器进行交互,广告位代码将用户的 cookie信息(包含对广告的访问次数)传给服务器(若是没有cookie,服务器会生成一个),服务器进行频次的匹配,超过频次设定的广告将不会被投 放,在同时判断了其余定向条件后,服务器回传适合的广告到浏览器进行投放,在返回信息的同时,还会将用户cookie上此广告的浏览次数加1。经过这种方 式,网络广告实现了精确的频次控制。
广告投放中,并非频次越高越好,过少的接触不会在接触的用户心中产生印象,过多的接触反而会使接触的用户产生不快,厌恶。1972年,美国心理学 家赫尔伯特.克鲁格曼通过研究,确立了消费者接触广告三次的心理学关系:第一次好奇:“这是什么?”第二次是认识:“干什么用的?”第三次是判断:“对广 告产生什么印象?”。固然,由于产品、市场、品牌、竞争、创意以及媒体等不一样,在频次设置上也会有所不一样,不过,对广告的有效接触频次限定通常都是以3次 为底限的。
为了了解广告的投放效果,在报表中,广告系统通常会提供平均接触频次、频次分布图。
讨论:频次分布图是什么样子?设计时须要注意什么?
咱们所讲的关键词定向实际上就是Google AdWords中的内容相关广告(Contextual)。
关键词定向实现必须具有如下能力:
抓取网页内容并进行分析的能力
分析时须要考虑到页面的结构、html标签、连接等影响,对页面的正文进行分析,获得最恰当的一些关键词来描述页面所表达的内容。关键词定向是否有效的瓶颈即在于此。
须要注意的是,因为实时快速分析页面的要求很是高,当页面足够多的时候,系统执行效率会很是的低下,所以必须具备提早抓取有可能出现广告页面的能力。
固然,实时快速分析一样重要。
广告系统中设置广告投放关键词的能力
须要可以确保操做人员能够方便快捷的在系统中进行关键词的设置(正向选择、反向排除),若是可以提供对以前投放的关键词效果分析及推荐更好。
投放核心快速匹配投放能力
将1的分析结果和2的投放设置进行快速匹配并进行投放,这是最根本的要求。
关键词定向的效果:
这里提到的在线广告做弊是指媒体为了刷广告流量而进行的做弊。他们的做弊手段不少, 这里介绍常见的几种。
iframe是广告做弊最经常使用的技巧,就是在本身的网页上嵌入iframe, 大小为0×0或1×1,也就是用户不可见。经过iframe打开其余页面,在用户看不见的状况下刷流量。别看iframe简单,里面花样不少。
一、页面内嵌入本站页面的iframe
iframe打开和当前页同样的页面地址,或本站的其余页面。 这样用户的一个浏览行为,很轻松就从1个pv翻倍变成2个pv。若是嵌入iframe多点, 就能翻3倍,4倍…。
但使用这个方法很容易被发现,广告投放方,经过分析UV,独立IP等很容易就发现异常。 这是很老的方法,不过仍是有些网站乐此不疲。
二、两个站点间互相嵌入对方站点页面的iframe
这是比较巧妙的做弊技巧,UV,独立IP等分析方法是不能发现异常的。
三、双层iframe
做弊的iframe为了避免让人看见,大小只有0×0或1×1,但有些在线广告在显示时会判断浏览窗口大小,若是过小可能就不能显示。这时有些网站就 采用了双层iframe技术来刷广告流量。 第一层1×1大小的iframe中又嵌入一个iframe,这个第二层iframe是正常浏览窗口大小,广告代码很难发现异常。
这种做弊方式使用巧妙的,会让主页面和两个iframe使用三个不一样的域名,这样由于跨域的问题, 里面的js不可能获得最外层真正的页面地址, 想抓证据都抓不到。
四、IP屏蔽
有些站点在进行做弊时,会屏蔽北京,上海等大城市的访问,你从这些地区访问时,看不到他们的做弊代码,一切正常。等换用其余地方的代理访问时,你在 他们页面里就能看到做弊用iframe代码。 这是由于不少IT,在线广告公司都在这些大城市,这种屏蔽让他们的做弊手段很难被同业发现。
五、购买垃圾流量
如今来自iframe,木马的垃圾流量都是明码标价在卖的,能够用这些流量来刷页面,刷广告。这种也比较难以发现。
网站去刷流量目的每每比较复杂,一是刷广告流量,赚广告商和广告主的钱,二是为了alexa之类的排名,也有是为了给投资人看所谓的“业绩”。
上面谈的基本都是CPM广告方式的做弊,下面说说其余的。
六、CPC做弊
CPC做弊实际上是很简单的,只要用iframe打开点击连接便可。
七、CPA做弊
有些网站广告按CPA结算,好比注册人数等。 这种状况下,有的公司会作专门的自动注册机,保证你的注册人数疯狂上涨。
八、CPS做弊
不少人感受CPS方式是不可能做弊的,其实这也是能够的。 卖个关子,下次和你们介绍。
其实大多数做弊方法经过耐心细致的分析,不难发现端倪。 但中国在线广告的做弊仍是至关严重,造成这种现象的缘由是蛮有意思的,和多人都探讨过, 有时间另写个博文分析。
[转载正文结束]
扫地老僧一直走在高精尖道路上,所以以上提到的都是比较巧妙以及难以发现的做弊方式,常常是一些流量比较大的媒体使用。不过目前还有大量的小流量媒体采用更原始的方式,那就是强制刷新页面,在用户看页面时,每一个几秒页面就刷新一次。