前言
通常互联网的项目都是部署在linux服务器上的,若是linux服务器出了问题,那么我们平时学习的高并发,稳定性之类的是没有任何意义的,因此对linux性能的把握就显得很是重要,固然不少同窗可能以为这些是运维同窗的事情,可是我不这么认为,无论你是架构师,仍是crud boy,对项目有个全局的掌控是一项很是重要的基本素质,因此总结了这篇文章,但愿对您有用,若是您以为我写的还不错,看完记得点个赞,点个再看哦。我们废话不用多说,直接进入正题。linux
影响linux服务器性能的因素
cpu
CPU是操做系统稳定运行的根本,CPU的速度与性能在很大程度上决定了系统总体的性能,所以,CPU数量越多、主频越高,服务器性能也就相对越好。ios
内存
内存的大小也是影响Linux性能的一个重要的因素,内存过小,系统进程将被阻塞,应用也将变得缓慢,甚至失去响应;内存太大,致使资源浪费。nginx
磁盘IO
磁盘的I/O性能直接影响应用程序的性能,在一个有频繁读写的应用中,若是磁盘I/O性能得不到知足,就会致使应用停滞。好在现今的磁盘都采用了不少方法来提升I/O性能,好比常见的磁盘RAID技术。算法
网络
Linux下的各类应用,通常都是基于网络的,所以网络带宽也是影响性能的一个重要因素,低速的、不稳定的网络将致使网络应用程序的访问阻塞,而稳定、高速的网络带宽,能够保证应用程序在网络上畅通无阻地运行。幸运的是,如今的网络通常都是千兆带宽或光纤网络,带宽问题对应用程序性能形成的影响也在逐步下降。服务器
经常使用的linux系统性能监控的命令
uptime(系统总体性能评估)
这里须要注意的是:load average这个输出值,这三个值的大小通常不能大于系统CPU的个数网络
那么如何查看cpu的个数呢?架构
查看系统cpu的信息并发
cat /proc/cpuinfo中的信息运维
其中cpu cores即为cpu的核数tcp
也能够用cat /proc/cpuinfo |grep "cores"|uniq直接查看
[root@test ~]# cat /proc/cpuinfo |grep "cores"|uniq cpu cores : 2
cpu的性能评估
利用vmstat命令监控cpu
vmstat 2 10 (每2秒监控一次 监控10次)
procs
r表示运行和等待cpu时间片的进程数,这个值若是长期大于cpu的个数,则须要增长系统cpu
b表示等待资源的进程数
CPU
us列显示了用户进程消耗CPU时间百分比,us比较高的时候,说明用户进程消耗cpu的时间多,若是长期大于50%,就须要优化程序和算法
sy列显示了内核进程消耗的cpu时间百分比,sy值较高的时候,说明内核消耗的cpu资源不少
根据经验,us+sy的参考值为80%,若是us+sy大于 80%说明可能存在CPU资源不足。
利用sar命令监控系统cpu
sar命令会增长系统开销 可是影响不大
yum install sysstat安装sar命令
sar -u 3 5(u显示系统全部cpu在采样时间内的负载状态) %user:用户进程消耗cpu的时间百分比
%nice:运行正常进程所消耗cpu的百分比
%system:系统消耗cpu时间百分比
%iowait:IO等待所占用cpu时间百分比
%steal:内存在相对紧张的环境下pagein强制对不一样页面进行的steal操做
%idle:cpu处在空闲时间的百分比
内存性能评估
利用free指令监控内存
free -m #查看以M为单位的内存使用状况 通常有这样一个经验公式:
应用程序可用内存/系统物理内存>70%时,表示系统内存资源很是充足,不影响系统性能。
应用程序可用内存/系统物理内存<20%时,表示系统内存资源紧缺,须要增长系统内存。
20%<应用程序可用内存/系统物理内存<70%时,表示系统内存资源基本能知足应用需求,暂时不影响系统性能。
利用vmstat监控内存
swpd表示切换到内存交换去的内存数量(k),若是swpd的值不为0,或者比较大,可是si,so的值长期为0,这种状况不用担忧,不会影响性能
free表示空闲的物理内存数量
buffer表示buffers cache的内存数量,通常对设备的读写才须要缓冲
cache表示page cached的内存数量。通常做为文件系统cached,频繁访问的文件都会被cached,若是cache值较大,说明cached的文件较多,若是此时IO中的bi比较小,说明文件系统效率比较好
si表示由磁盘调入内存,也就是内存进入内存交换区的数量
so表示由内存调入磁盘,也就是内存交换区进入内存的数量 通常状况下,so si的值都为0。若是si so的值长期不为0,则表示系统内存不足,须要增长内存
磁盘IO性能评估
iostat
iostat -d 2 10
Blk_reads/s 每秒读取的数据块数 Blk_wrtn/s 每秒写入的数据块数 Blk_read 读取的全部块数 Blk_wrtn 写入的全部块数
这几个值没有标准 若是长期都很大 确定是不正常的
利用sar评估磁盘性能
sar -d 2 5 await 平均每次设备I/O操做的等待时间(毫秒)
svctm 平均每次设备I/O操做的服务时间(毫秒)
%util 一秒中有百分之几的时间用于I/O操做
评判标准
正常状况下svctm应该是小于await的,svctm的值和磁盘性能,cpu内存等都有关系
若是svctm的值和await的值相近表示几乎没有I/O等待,磁盘性能很好,若是await的值远高于svctm,表示I/O队列等待时间太长,系统上的应用程序将变慢,此时能够经过更换更快的硬盘来解决问题
%util越小越好,若是%util接近100%表示磁盘产生的I/O请求太多,I/O系统已经满负载在工做,此时能够经过优化程序或者更换更快的磁盘来解决问题
网络性能评估
经过ping命令检测网络的连通性。
经过netstat -i 组合检测网络接口情况。
经过netstat -r 组合检测系统路由表信息。
经过sar -n 组合显示系统的网络运行状态(sar -n DEV 5 3)。
经常使用分析:
查看tcp链接数最多的ip:
sudo netstat -pant | grep ":22" | awk '{print $5}' | awk -F":" '{print $4}' |sort|uniq -c|sort -nr
解释:
awk -F":" '{print $4}' 表示把结果的第4列用:号分割
sort -nr 排序,-n以数值大小排序,-r倒序,从大到小。
uniq -c 删除重复的行,-c表示加上每行出现的次数。
netstat命令是一个监控TCP/IP网络的很是有用的工具, 它能够显示路由表、实际的网络链接以及每个网络接口设备的状态信息。
netstat -pant
参数-p :显示正在使用Socket的程序识别码和程序名称;
参数-a :显示全部连线中的Socket;
参数-n :直接使用ip地址,而不经过域名服务器;
参数-t :显示TCP传输协议的连线情况。
提取访问nginx服务器最多的10个ip。
cat access.log | awk '{print $1}' | sort | uniq -c | sort -nr | head -n10