W3C扩展格式网站日志含义分析

1、什么是网站日志浏览器

  WEB 日志是网站的WEB服务处理程序,根据必定的规范生成的ASCII文本。它主要记录了网站访问记录数据内容,是网站分析和网站数据仓库的数据基础来源。服务器

  网站分析和数据分析也将对SEO产生必定的影响,经过WEB日志,咱们能够看到各大搜索引擎蜘蛛对网站的抓取状况,这对SEO工做是很是重要的。因此了解WEB日志的格式和组成将有利于咱们更好地进行网站数据的收集、处理和分析,从而更好的进行网站优化。cookie

  2、日志文件的类型优化

  目前常见的WEB日志格式主要由两类,一类是Apache的NCSA日志格式,另外一类是IIS的W3C日志格式。NCSA格式又分为NCSA普通日志格式 (CLF)和NCSA扩展日志格式(ECLF)两类,目前最经常使用的是NCSA扩展日志格式(ECLF)及基于自定义类型的Apache日志格式;而W3C 扩展日志格式(ExLF)具有了更为丰富的输出信息,主要是微软IIS(Internet Information Services)中应用。网站

  3、W3C扩展WEB日志分析搜索引擎

  下面是一段常见的IIS生产的W3C扩展WEB日志spa

  2011-09-01 16:02:22 GET /Enterprise/detail.asp 70.25.29.53 http:/ /www .example.com/searchout.asp 202 17735 369 4656代理

  这个日志能够解读为:IP是70.25.29.53,来自"http://www.example.com/searchout.asp"的访客,在2011-09-01 16:02:22,访问(GET)了主机的/Enterprise/detail.asp,访问成功,获得17735字节数据。日志

  日期:date 动做发生时的日期。code

  时间:time 动做发生时的时间(默认为UTC标准)。

  客户端IP地址:c-ip 访问服务器的客户端IP地址。

  用户名:cs-username 经过身份验证的访问服务器的用户名。不包括匿名用户(用‘-’表示)。

  服务名:s-sitename 客户所访问的Internet服务名以及实例号。

  服务器名:s-computername 产生日志条目的服务器的名字。

  服务器IP 地址:s-ip 产生日志条目的服务器的IP地址。

  服务器端口:s-port 服务端提供服务的传输层端口。

  方法:cs-method 客户端执行的行为(主要是GET与POST行为)。

  URI Stem:cs-uri-stem 被访问的资源,如Default.asp等。

  URI Query:cs-uri-query 客户端提交的参数(包括GET与POST行为)。

  协议状态:sc-status 用HTTP或者FTP术语所描述的、行为执行后的返回状态。

  Win32状态:sc-win32-status 用Microsoft Windows的术语所描述的动做状态。

  发送字节数:sc-bytes 服务端发送给客户端的字节数。

  接受字节数:cs-bytes 服务端从客户端接收到的字节数。

  花费时间:time-taken 执行这次行为所消耗的时间,以毫秒为单位。

  协议版本:cs-version 客户端所用的协议(HTTP、FTP)版本。对HTTP协议来讲是HTTP 1.0或者HTTP 1.1。

  主机:cs-host 客户端的HTTP报头(host header)信息。

  用户代理:cs(User-Agent) 客户端所用的浏览器版本信息。

  Cookie:cs(Cookie) 发送或者接受到的cookie内容。

  Referrer:cs(Referer) 用户浏览的前一个网址,当前网址是从该网址连接过来的。

  协议底层状态:sc-substatus 协议底层状态的一些错误信息。

笨鸟先飞早入林,笨人勤学早成材。

转载请注明出处:
撰写人:fox-yu  http://www.cnblogs.com/fox-yu/
相关文章
相关标签/搜索