网站访问日志分析

查看日志代码以下:

2010-04-19 02:47:53 GET /index.html - 121.19.86.133 HTTP/1.1 Mozilla/4.0+(compatible;+MSIE+6.0;+Windows+NT+5.1;+SV1;+.NET+CLR+2.0.50727) http://www.baidu.com/s? 200 0 7990
2010-04-19 02:47:53 GET /p_w_picpaths/bg.gif - 121.19.86.133 HTTP/1.1 Mozilla/4.0+(compatible;+MSIE+6.0;+Windows+NT+5.1;+SV1;+.NET+CLR+2.0.50727) http://www.wz0312.cn/ 200 0 403
2010-04-19 02:47:53 GET /p_w_picpaths/tab.gif - 121.19.86.133 HTTP/1.1 Mozilla/4.0+(compatible;+MSIE+6.0;+Windows+NT+5.1;+SV1;+.NET+CLR+2.0.50727) http://www.wz0312.cn/ 200 0 571

日志解析:

以第一行为例:2010-04-19 02:47:53 GET /index.html - 121.19.86.133 HTTP/1.1 Mozilla/4.0+(compatible;+MSIE+6.0;+Windows+NT+5.1;+SV1;+.NET+CLR+2.0.50727) http://www.baidu.com/s? 200 0 7990
2010-04-19 02:47:53   日期和时间;
GET                   从服务器获取信息,通常为 GET或者POST;
/index.html           网站的首页;
121.19.86.133         请求客户端ip地址;
HTTP/1.1              文件传输协议1.1;
Mozilla/4.0+          表示使用的是与Netspace兼容的Mozilla浏览器;
compatible            适合的,兼用的;
MSIE6.0               微软公司出品的IE浏览器6.0版本;
Windows NT 5.1        微软公司出品的服务器操做系统;
SV1=Security Version 1   安全版本1;
http://www.baidu.com/s?  请求页面连接;
200                      表示返回OK状态;

附:一些经常使用代码含义

2xx----正常响应信息;

200(成功) 服务器已成功处理了请求。一般,这表示服务器提供了请求的网页。若是针对您的 
    robots.txt 文件显示此状态代码,则表示搜索引擎已成功检索到该文件。
201(已建立) 请求成功而且服务器建立了新的资源。
202(已接受) 服务器已接受请求,但还没有处理。
203(非受权信息) 服务器已成功处理了请求,但返回的信息可能来自另外一来源。
204 响应不一样,此响应要求请求者重置文档视图(例如,清除表单内容以输入新内容)。
205(重置内容) 服务器成功处理了请求,但没有返回任何内容。
206(部份内容) 服务器成功处理了部分 GET 请求;

3xx----URL重定向信息;

300(多种选择) 针对请求,服务器可执行多种操做。服务器可根据请求者(user agent)选 择一项操
   做,或提供操做列表供请求者选择。
301(永久移动) 请求的网页已永久移动到新位置。服务器返回此响应(对GET或HEAD请 求的响应)
   时,会自动将请求者转到新位置。您应使用此代码告诉 Googlebot 某个网 页或网站已永久移动
   到新位置。
302(临时移动) 服务器目前从不一样位置的网页响应请求,但请求者应继续使用原有位置来进 行之后
   的请求。此代码与响应GET或HEAD请求的301代码相似,会自动将请求者 转 到不一样的位置,但您
   不该使用此代码来告诉 Googlebot 某个网页或网站已经移动, 由于 Googlebot 会继续抓取原
   有位置并编制索引。
303(查看其余位置) 请求者应当对不一样的位置使用单独的 GET 请求来检索响应时,服务器 返回此
   代码。对于除HEAD以外的全部请求,服务器会自动转到其余位置。
304(未修改) 自从上次请求后,请求的网页未修改过。服务器返回此响应时,不会返回网 页内容。
305(使用代理) 请求者只能使用代理访问请求的网页。若是服务器返回此响应,还表示请 求者应使
   用代理。
307(临时重定向) 服务器目前从不一样位置的网页响应请求,但请求者应继续使用原有位置来 进行以
   后的请求。此代码与响应 GET 和 HEAD 请求的 301 代码相似,会自动将请求 者转到不一样的位
   置,但您不该使用此代码来告诉 Googlebot 某个页面或网站已经移动, 由于 Googlebot 会继
   续抓取原有位置并编制索引。

4xx----暂时性错误,客户端错误;

400(错误请求) 服务器不理解请求的语法。
401(未受权) 请求要求身份验证。对于须要登陆的网页,服务器可能返回此响应;
403(禁止) 服务器拒绝请求。若是您在 Googlebot 尝试抓取您网站上的有效网页时看到此 状态代
   码(能够在Google网站管理员工具诊断下的网络抓取页面上看到此信息),可能 是您的服务器或
   主机拒绝 Googlebot 访问。
404(未找到) 服务器找不到请求的网页。例如,对于服务器上不存在的网页常常会返回此 代码。

5xx----永久性错误,没有权限时会提示;

500(服务器内部错误) 服务器遇到错误,没法完成请求。
501(还没有实施) 服务器不具有完成请求的功能。
相关文章
相关标签/搜索