网站用户身份标识的识别

用户分析是网站分析中一个重要的组成部分,在分析用户以前咱们必须首先可以识别每一个用户,分辨哪些是”New Customer”,哪些是”Repeat Customer”。这样不但可以更加清晰地了解到底有多少用户访问了你的网站,分辨他们是谁(用户ID、邮箱、性别年龄等);同时也可以帮助你更好地跟 踪你的用户,发现它们的行为特征、兴趣爱好及个性化的设置等,以便于更好地把握用户需求,提高用户体验。html

一般当你的网站提供了注册服务,而用户注册并登录过你的网站,那么用户能够更容易地被识别,由于网站通常都会保存注册用户的详细信息;可是你的网站并不须要注册,而用户的行为以浏览为主,这是用户识别就会显得较为困难,下面提供了几种经常使用的用户识别的方法:web

识别用户的几种方法数据库

当用户并未注册登陆的状况下,识别用户的惟一途径就只剩下用户浏览行为的点击流数据,一般状况下它们会保存在WEB日志里面,关于WEB日志的详细说明能够参考我以前的文章——WEB日志格式。而WEB日志自己存在的缺陷可能致使用户识别的不许确性,关于WEB日志的缺陷能够参考以前的文章——WEB日志的做用和缺陷,因此咱们在选择用户识别方法的过程当中,在条件容许的状况下尽可能选择更为准确的方法:cookie

一、基于IP的用户识别网络

IP地址是最容易获取的信息,任何的WEB日志中均会包含,但其局限性也较为明显:伪IP、代理、动态IP、局域网共享同一公网IP出口……这些状况都会影响基于IP来识别用户的准确性,因此IP识别用户的准确性比较低,目前通常不会直接采用IP来识别用户。工具

获取难度:★网站

准确度:★代理

二、基于IP+Agent的用户识别日志

一样基于最简单形式的WEB日志,咱们能够增长一项——Agent,来提升单一IP方式识别用户的准确性。Agent也是WEB日志中通常都会 包含的信息,经过IP+Agent的方式能够适当提升IP代理、公用IP这类状况下用户的分辨度,同时经过Agent还能够识别网络爬虫等特殊“用户”, 但一样准确度也欠高。orm

获取难度:★

准确度:★★

三、基于cookie的用户识别

当你经过自定义Apache日志格式或者JavaScript的方法得到用户cookie的时候,其实你已经找到了一个更有效的用户识别的手 段。cookie在未被清除的其前提下能够认为是跟某个访问客户端电脑绑定的(一个客户端有可能包含多个cookie),因此用cookie来标识用户其 实指的是用户使用的客户端电脑,而并不是用户自己。

用cookie识别用户的方法固然也存在缺陷:最多见的就是cookie被清除而致使用户没法与原先记录实现对应;同时因为客户端电脑会被共用,或者用户会在不一样的电脑上访问你的网站,这个时候cookie就没法直接对应到该用户了。

获取难度:★☆

准确度:★★☆

四、基于用户ID的用户识别

基于用户ID的用户识别是最为准确,由于通常状况下用户不一样共享他的用户ID,因此咱们能够认为数据中的userid惟一地指向该用户,几乎不 存在误差。固然要使用用户ID来识别用户是须要必定的前提条件的:网站必须是提供用户注册登陆服务的,而且能够经过一些手段在点击流数据中记录 userid。

获取难度:★★

准确度:★★★

因此对于一个须要用户ID注册登陆的网站来讲,用户惟一标识符的选择能够听从如下顺序:当用户注册登陆时以userid为准,当用户在未登陆状 态浏览时以用户的cookie为准,当用户未登陆且cookie没法获取的状况下以IP+Agent为准;这样就能从最大程度上识别惟一用户。

这里推荐一个网站日志中cookie项的自定义设置方法,以便更好地识别用户。cookie是从用户端存放的cookie文件记录中获取的,这 个文件里面通常在包含一个cookieid的同时也会记下用户在该网站的userid(若是你的网站须要注册登录而且该用户曾经登陆过你的网站且 cookie未被删除),因此在记录日志文件中cookie项的时候能够优先去查询cookie中是否含有用户ID类的信息,若是存在则将用户ID写到日 志的cookie项,若是不存在则查找是否有cookieid,若是有则记录,没有则记为”-”,这样日志中的cookie就能够直接做为最有效的用户惟 一标识符被用做统计。固然这里须要注意该方法只有网站自己才可以实现,由于用户ID做为用户隐私信息只有该网站才知道其在cookie的设置及存放位置, 第三方统计工具通常很难获取。

获取用户信息的途径

经过以上的方法实现用户身份的惟一标识后,咱们能够经过一些途径来采集用户的基础信息、特征信息及行为信息,而后为每位用户创建起详细的Profile:

1) 用户注册时填写的用户注册信息及基本资料;

2) 从网站日志中获得的用户浏览行为数据;

3) 从数据库中获取的用户网站业务应用数据;

4) 基于用户历史数据的推导和预测;

5) 经过直接联系用户或者用户调研的途径得到的用户数据;

6) 有第三方服务机构提供的用户数据。

相关文章
相关标签/搜索