一文掌握 Linux 性能分析之网络篇(续)

本文首发于个人公众号 CloudDeveloper(ID: cloud_dev),专一于干货分享,号内有大量书籍和视频资源,后台回复 「1024」便可领取,欢迎你们关注,二维码文末能够扫。

这是 Linux 性能分析系列的第五篇,前四篇在这里:node

一文掌握 Linux 性能分析之 CPU 篇编程

一文掌握 Linux 性能分析以内存篇网络

一文掌握 Linux 性能分析之 IO 篇socket

一文掌握 Linux 性能分析之网络篇工具

在上篇网络篇中,咱们已经介绍了几个 Linux 网络方向的性能分析工具,本文再补充几个。总结下来,余下的工具包括但不限于如下几个:性能

  • sar:统计信息历史
  • traceroute:测试网络路由
  • dtrace:TCP/IP 栈跟踪
  • iperf / netperf / netserver:网络性能测试工具
  • perf 性能分析神器

因为篇幅有限,本文会先介绍前面两个,其余工具留做后面介绍,你们能够持续关注。测试

sar

sar 是一个系统历史数据统计工具。统计的信息很是全,包括 CPU、内存、磁盘 I/O、网络、进程、系统调用等等信息,是一个集大成的工具,很是强大。在 Linux 系统上 sar --help 一下,能够看到它的完整用法。云计算

  • -A:全部报告的总和
  • -u:输出 CPU 使用状况的统计信息
  • -v:输出 inode、文件和其余内核表的统计信息
  • -d:输出每个块设备的活动信息
  • -r:输出内存和交换空间的统计信息
  • -b:显示 I/O和传送速率的统计信息
  • -a:文件读写状况
  • -c:输出进程统计信息,每秒建立的进程数
  • -R:输出内存页面的统计信息
  • -y:终端设备活动状况
  • -w:输出系统交换活动信息
  • -n:输出网络设备统计信息

在平时使用中,咱们经常用来分析网络情况,其余几项的一般有更好的工具来分析。因此,本文会重点介绍 sar 在网络方面的分析手法。spa

Linux 系统用如下几个选项提供网络统计信息:code

  • -n DEV:网络接口统计信息。
  • -n EDEV:网络接口错误。
  • -n IP:IP 数据报统计信息。
  • -n EIP:IP 错误统计信息。
  • -n TCP:TCP 统计信息。
  • -n ETCP:TCP 错误统计信息。
  • -n SOCK:套接字使用。

咱们来看几个示例:

(1)每秒打印 TCP 的统计信息。

sar -n TCP 1

几个参数了解一下:

  • active/s:新的 TCP 主动链接(也就是 socket 中的 connect() 事件),单位是:链接数/s。
  • passive/s:新的 TCP 被动链接(也就是 socket 中的 listen() 事件)。
  • iseg/s:接收的段(传输层以段为传输单位),单位是:段/s
  • oseg/s:发送的段。

经过这几个参数,咱们基本能够知道当前系统 TCP 链接的负载状况。

(2)每秒打印感兴趣的网卡的统计信息

sar -n DEV 1 | awk 'NR == 3 || $3 == "eth0"'

几个参数了解一下:

  • rxpck/s / txpck/s:网卡接收/发送的数据包,单位是:数据包/s。
  • rxkB/s / txkB/s:网卡接收/发送的千字节,单位是:千字节/s。
  • rxcmp/s / txcmp/s:网卡每秒接受/发送的压缩数据包,单位是:数据包/s。
  • rxmcst/s:每秒接收的多播数据包,单位是:数据包/s。
  • %ifutil:网络接口的利用率。

这几个参数对于分析网卡接收和发送的网络吞吐量颇有帮助。

(3)错误包和丢包状况分析

sar -n EDEV 1

几个参数了解一下:

  • rxerr/s / txerr/s:每秒钟接收/发送的坏数据包
  • coll/s:每秒冲突数
  • rxdrop/s:由于缓冲充满,每秒钟丢弃的已接收数据包数
  • txdrop/s:由于缓冲充满,每秒钟丢弃的已发送数据包数
  • txcarr/s:发送数据包时,每秒载波错误数
  • rxfram/s:每秒接收数据包的帧对齐错误数
  • rxfifo/s / txfifo/s:接收/发送的数据包每秒 FIFO 过速的错误数

当发现接口传输数据包有问题时,查看以上参数可以让咱们快速判断具体是出的什么问题。

OK,这个工具就介绍到这里,以上只是抛砖引玉,更多技巧还须要你们动手去探索,只有动手,才能融会贯通。

traceroute

traceroute 也是一个排查网络问题的好工具,它能显示数据包到达目标主机所通过的路径(路由器或网关的 IP 地址)。若是发现网络不通,咱们能够经过这个命令来进一步判断是主机的问题仍是网关的问题。

它经过向源主机和目标主机之间的设备发送一系列的探测数据包(UDP 或者 ICMP)来发现设备的存在,实现上利用了递增每个包的 TTL 时间,来探测最终的目标主机。好比开始 TTL = 1,当到达第一个网关设备的时候,TTL - 1,TTL = 0 致使网关响应一个 ICMP 超时报文,这样,若是没有防火墙拦截的话,源主机就知道网关设备的地址。以此类推,逐步增长 TTL 时间,就能够探测到目标主机之间所通过的路径。

为了防止发送和响应过程出现问题致使丢包,traceroute 默认会发送 3 个探测包,咱们能够用 -q x 来改变探测的数量。若是中间设备设置了防火墙限制,会致使源主机收不到响应包,就会显示 * 号。以下是 traceroute baidu 的结果:

每一行默认会显示设备名称(IP 地址)和对应的响应时间。发送多少个探测包,就显示多少个。若是只想显示 IP 地址能够用 -n 参数,这个参数能够避免 DNS 域名解析,加快响应时间。

和这个工具相似的还有一个工具叫 pathchar,但平时用的很少,我就不介绍了。

以上就是两个工具的简单介绍,工具虽然简单,但只要能解决问题,就是好工具。固然,性能分析不只仅依靠工具就能解决的,更多须要咱们多思考、多动手、多总结,逐步培养本身的系统能力,才能融会贯通

参考:

iperf3
netperf netserver
https://www.jianshu.com/p/42e...


个人公众号 cloud_dev,号内有大量书籍和视频资源,后台回复 「1024」便可领取,分享的内容包括但不限于云计算虚拟化、容器、OpenStack、K8S、雾计算、网络、工具、SDN、OVS、DPDK、Linux、Go、Python、C/C++编程技术等内容,欢迎你们关注。

相关文章
相关标签/搜索