Nginx日志分析和参数详解

本文档主要介绍Nginx设置日志参数的做用,以及Nginx日志经常使用分析命令前端


基本大纲:
nginx

  1.Nginx日志记录格式的介绍web

  2.Nginx日志参数详解
apache

  3.Web服务流量名词介绍浏览器

  4.Nginx日志经常使用分析命令示范服务器




一:Nginx日志记录格式的介绍
并发


log_format用来设置日志的记录格式:
负载均衡

log_format name formatide

name表示格式名称,format表示等义的格式。log_format有一个默认的无需设置的combined日志格式,至关于apache的combined日志格式,以下所示:网站

log_format  combined  '$remote_addr - $remote_user  [$time_local]  '

                                   ' "$request"  $status  $body_bytes_sent  '

                                   ' "$http_referer"  "$http_user_agent" ';

若是nginx位于负载均衡器,squid,nginx反向代理以后,web服务器没法直接获取到客户端真实的IP地址了。  $remote_addr获取反向代理的IP地址。反向代理服务器在转发请求的http头信息中,能够增长X-Forwarded-For信息,用来记录客户端IP地址和客户端请求的服务器地址。

 

下面是修改后,生产环境下代理服务器用的日志格式。能够根据须要添加对应的日志参数

log_format  main  '$remote_addr - $remote_user [$time_local] requesthost:"$http_host"; "$request" requesttime:"$request_time"; '

                      '$status $body_bytes_sent "$http_referer" - $request_body'

                      '"$http_user_agent" "$http_x_forwarded_for"';




二:Nginx日志参数详解


参数注释以下:


$remote_addr   #与$http_x_forwarded_for 用以记录客户端的ip地址


$http_x_forwarded_for   #当前端有代理服务器时,设置web节点记录客户端地址的配置,此参数生效的前提是代理服务器也要进行相关的http_x_forwarded_for设置


$remote_user   #记录客户端用户名称,通常默认为空


$time_local   #记录访问时间


$request   #记录请求的URL和HTTP协议


$status   #记录请求状态


$body_bytes_sent   #记录发送给客户端文件内容大小


$http_referer   #记录从哪一个页面连接访问过来的


$http_user_agent   #记录客户端浏览器相关信息


$request_time   #处理完请求所花时间,以秒为单位 


$http_host   #请求地址,即浏览器中你输入的地址(IP或域名)


$request_body   #记录POST数据


$request_length   #客户端请求的长度


$upstream_status   #upstream状态,成功是200


$upstream_addr  #后台upstream的地址,即真正提供服务的主机地址


$upstream_response_time    #请求过程当中,upstream响应时间




三:Web服务流量名词介绍


网站并发链接数:定义为网站服务器在单位时间内可以处理的最大链接数。示例:某网站的并发是5000.意味着单位时间内(理解为1秒或数秒内),正在处理的链接数,正在创建的链接数,加起来一共是5000个。


IP:即Internet Protocol,通常指独立IP数,独立IP数是指不一样IP地址的计算机访问网站时被计的总次数。通常一天00:00-24:00内相同IP地址只被计算一次。


PV:即Page View,中文翻译为页面浏览,即页面浏览量或点击量,无论客户端是否相同,也无论IP和网站页面是否相同,用户只要访问网站页面就会计算PV,一次计为一个PV


UV:即Unique Visitor,同一个客户端(PC或移动端)访问网站被计为一个访客。一天(00:00-24:00)内相同的客户端访问同一个网站只统计一次UV。UV通常是以客户端Cookie等技术做为统计依据的,实际统计会有偏差。


IP,PV,UV的区别在哪?

  举例说明:假设某个公司有10个员工,都访问了www.taobao.com这个网站。每一个人平均浏览了5个页面,可是公司的对外出口是一个公网IP。因此对于www.taobao.com这个网站而言,只会计算1个独立IP访问。可是由于有10我的在访问www.taobao.com这个网站,而且平均都访问了5次,所以,对于www.taobao.com这个网站而言,PV数就是10x5=50个PV,而由于有10我的访问,就是10个不一样的客户端访问,所以,UV(独立访客)为10.   

  所以上例结果为IP数为1个,PV数为50个,UV为10个。经过这个结果,不难看出,一个网站的独立IP数量要比网站实际访问的PV数量小得多。一般状况下,网站的UV数也会大于独立IP数

                                                                                                                                                             



四:Nginx日志经常使用分析命令示范(注:日志的格式不一样,awk取的项不一样。下面命令针对上面日志格式执行)


1)总请求数

wc -l  access.log |awk '{print $1}'


2)独立IP数

awk '{print $1}' access.log|sort |uniq |wc -l


3)每秒客户端请求数 TOP5

awk '{print $6}' access.log|sort|uniq -c|sort -rn|head -5


4)访问最频繁IP Top5

awk '{print $1}' access.log|sort |uniq -c |sort -nr |head -5


5)访问最频繁的URL TOP5

awk '{print $7}' access.log|sort |uniq -c |sort -nr |head -5


6)响应大于5秒的URL TOP5

awk '{if ($7 > 5){print $6}}' access.log|sort|uniq -c|sort -rn |head -5


7)HTTP状态码(非200)统计 Top5

awk '{if ($11 != 200){print $11}}' access.log|sort|uniq -c|sort -rn|head -5


8)分析请求数大于50000的源IP

cat access.log|awk '{print $NF}'|sort |uniq -c |sort -nr|awk '{if ($1 >50000){print $2}}'

相关文章
相关标签/搜索