网络端口采用了1000M速率时候出现网络通讯丢包+IDC机房托管服务器之间通讯不顺畅

时间 2020-05-26

标签网络端口采用 1000m 速率时候出现通讯 idc 机房托管服务器之间顺畅栏目系统网络繁體版

原文原文链接

网络端口采用了1000M速率时候出现网络通讯丢包+IDC机房托管服务器之间通讯不顺畅

网络故障：
交换机端口1000M，网卡也是1000M，网卡配置正常。ping时候间隔丢包。
表现为网络通讯丢包，而且排除了其余网络设置故障。

故障缘由：使用的网线非严格质量的超六类网线，网线质量没法达1000M。

解决方法：将交换机端口设置成100M端口；或者更换为超六类网线。

故障出现状况：网络端口采用了1000M速率时候出现网络通讯丢包。

目录：
1.实例场景。网络端口采用了1000M速率时候出现网络通讯丢包
2.生产环境。IDC机房托管服务器之间通讯不顺畅,祸起ping丢包
3.原理剖析机理分析。为何会出现网络丢包的状况，网络丢包的缘由是什么？

【实例场景生产环境】

最近一些局域网的个别互联网用户反映上网不稳定时通时断，结合此次维修工做实际讲一下解决此类问题的一点心得。

1、简单介绍Ping丢包率概念

数据在网络中是被分红一个个数据包传输的,每一个数据包中都有表示数据的信息和提供数据路由的桢。而数据包在通常介质中传播是总有一小部分因为两个终端的距离过大会丢失,而大部分数据包都会到达目的终端.所谓网络丢包率是数据包丢失部分与所传数据包总数的比值.正常传输时网络丢包率应该控制在必定范围内。

在cmd 中键入ping [网址]，显示最后一行(x% loss)就是对目标地址ping包的丢包率。

2、了解一下单位互联网用户宽带接入方式拓扑图(如图1所示)

●图1

3、解决问题的步骤方向

此次咱们要解决的问题是用户电脑丢包严重，有时会影响用户正常上网，此次解决问题的方法是顺藤摸瓜，意思是说由用户电脑自下而上查找问题。

4、分步骤判断出问题所在。

(一)介绍形成用户PC上网丢包缘由：

一、计算机网卡是否损坏;

二、RJ45头是否损坏,是否线路错误;

三、网线是否折伤;

四、设备故障;

下面首先使用用户的电脑，在cmd 中键入ipconfig显示如图2所示

●图2

获得该网络的网关(Default Gateway)后，ping 192.168.0.2 -t获得该网络丢包率大如图3所示

●图3

获得上述信息后，为了排除故障点，用本身随身携带的笔记本ping 192.168.0.2获得的结果依然如图3所示，首先能够排除不是用户电脑网卡的故障。接着查看用户水晶头是否制做规范，为了保险起见，将水晶头截掉从新作了新的水晶头，但是故障依旧。这时候就要从用户这台机器脱离向上找问题，即顺藤摸瓜的方法。

为了能在24×××换机中迅速定位那根网线是该用户的，咱们须要用户帮助我不停地作从网口上拔插网线动做，我就可在交换机指示灯处看到某个灯一灭一亮，注意这里说的一灭一亮并非频闪，而是灭了又亮。采用上述办法就能够判断出7口为用户所接的交换机的端口，从交换上拔下该网线，用直通线一端接7口，一端笔记本，依然丢包，这样能够排除是网线的问题。

须要说明的是此次报修的互联网用户是极个别的，说明这个网络中，绝大部分用户上网是正常的，找到该交换机空余的端口，用直通线一端接上，一端接测试用笔记本，目的是经过这种步骤测试出那个端口是无缺的，若是这个不行，能够试下一个，依次类推，找到一个无缺的端口，尽可能多测试一会，为了节省时间测试端口时，能够一直运行着ping包的命令，待出现4图的情形后，基本可判定该端口可正常使用。

●图4

为了保证该端口的能正常使用，能够多ping一段时间出现图5所示的情形。能够将将此次查修用户的网线插入该测试好的端口中，并加注标签，以备下次容易查修，而后到用户电脑上运行cmd命令，ping192.168.02 -t 能够获得网络正常、ping包正常，这次维修工做也已完成。

5、总结

交换机端口出现故障，究其缘由是由于交换机自身的性能发生老化，这就意味着故障交换机的确出现了硬件性能降低的现象，所以会出现上网数据丢包严重的现象。总结此次工做，本身的一点心得就是要细心，在平时的工做中多积累，多总结，下次再出现此类问题就能够迅速的找到问题的所在点，并快速解决问题!

【实例场景生产环境】

IDC机房托管服务器之间通讯不顺畅,祸起ping丢包

　　两个IDC机房托管的服务器之间通讯不顺畅，经查，两个机房间的ping丢包率在8%左右。这样的丢包率很容易引发TCP链接失败，因为网络在线业务异常重要，不得有片刻的停机。因此刻不容缓，立刻处理丢包问题。

●图5

　　一.ping丢包缘由分析

　　端口速率不匹配是引发丢包的最直接的缘由。而引发端口速率变成半双工的缘由多是网络闪断引发的，好比网关那端的端口速率发生变化，而我方交换机的端口是自适应的，所以在协商后就变成半双工了。

　　二.判断ping丢包发生在哪里

　　从办公室的计算机分别ping 两个机房的服务器，而后ping网关，经过对输出进行比较，发现问题出在办公地点—望京的机房。再用路由跟踪的方式测试，得出同样的结论。

　　三.现场排查服务器之间通讯不顺畅

　　检查网段类服务器之间，服务器与交换机之间，以及交换机之间的网络通讯状况时，发ping 包，没有丢包，但从网内ping 外部任何地址，都有丢包现象出现，路由跟踪有时不成功。这些状况能够代表网段内的通讯是彻底正常的。

　　接下来要作的事情就是测试网关的状态。网关是一个Cisco 6509交换机，是网通本身管理，我方的交换机经过一条双绞线与Cisco 6509相连，它是全部服务器的外联接口。经过技术手段，已经知道上联交换机的上联端口是Fa0/41。

　　(1)从网段内的某些服务器ping网关，发现丢包。

　　(2)从外网的某台计算机ping 这个网关，没有丢包发生。

　　(3)从外网的某些计算机执行到这个网关的路由跟踪，状况正常。

　　(4)用外网远程的交换机ping小包，状况正常。

　　(5)从网段内的交换机ping小包，发现丢包。

　　由上面的测试结果能够得出结论：是我方的交换机与网通交换机(我方服务器的网关)间的链路出现故障。前几天我方为扩容在机架上施工，有可能碰到了线缆。

　　因而查看交换机指示灯状态。发现有一个端口指示灯黄绿交替闪烁，仔细一看，是某个交换机的41号端口，并且网线上标明这条线是整个网段的上联线，即与网关相连的那条线，和先前测试出来的端口是一致的。可能问题就出如今这个交换机上。因而连上Console线，登陆这台交换机，用命令“# show int f0/41”查看41号端口的输出，嘿嘿!竟然变成半双工了。再查看其余一些端口的双工状况，均是自适应，询问IDC 机房的人，确认网关那个链接端口的双工配置，网关的端口为全双工。

　　好，立刻进入配置模式，输入“# config t, int f0/41,# duplex full”就把交换机的41号端口设置成全双工了，保存配置。再查看41号端口指示灯的状态，变为绿色，这代表故障已经排除。从内外来测试丢包的状况，一切恢复正常。

【原理剖析机理分析】

为何会出现网络丢包的状况，网络丢包的缘由是什么？

网络丢包是咱们在使用ping对目站进行询问时，数据包因为各类缘由在信道中丢失的现象。ping使用了ICMP回送请求与回送回答报文。

    ICMP回送请求报文是主机或路由器向一个特定的目的主机发出的询问，收到此报文的机器必须给源主机发送ICMP回送回答报文。这种询问报文用来测试目的站是否可到达以及了解其状态。
    须要指出的是，ping是直接使用网络层ICMP的一个例子，它没有经过运输层的UDP或TCP.
    网络丢包的缘由主要有物理线路故障、设备故障、病毒***、路由信息错误等，下面咱们结合具体状况进行说明。
路由错误
    网络路径错误也会致使数据包不能到达目的主机，如主机的默认路由配置错误，主机发出的访问其余网络的数据包会被网关丢弃。但此类丢包属于正常状况下的丢包，是意料之中的，不会对网络形成影响。
设备故障
    设备故障主要是指设备硬件方面的故障，不包含软件配置不当形成的丢包。如网卡是坏的，交换机的某个端口出现了物理故障，光纤收发器的电端口与网络设备接口，或两端设备接口的双工模式不匹配。
    笔者近日在工做中发现一交换机端口的光纤模块故障形成的丢包现象，该交换机在通讯一段时间后死机，即不能通讯，重启后恢复正常。在通过一段时间观察后发现，某光纤模块存在问题，取一块新的模块替换，一切正常。
    究其缘由，交换机会对全部接收到的数据包进行CRC错误检测和长度校验，将检查出有错误的包丢弃，正确的包转发出去。但这个过程当中有些有错误的包在CRC错误检测和长度校验中都均未检测出错误，这样的包在转发过程当中不会被发送出去，也不会被丢弃，它们将会堆积在动态缓存中，永远没法发送出去，等到缓存中堆积满了，就会形成交换机死机的现象。
    最终结果是，数据包没法到达目的主机。
●物理线路故障
    网管员发现广域网线路时通时断，发生这种状况时，有多是线路出现故障，也多是用户方面的缘由。为了分清是不是线路故障，能够作以下测试。
    若是广域网线路是经过路由器实现的，能够登陆到路由器，经过扩展ping向对端路由器广域网接口发送大量的数据包进行测试。
    若是线路是经过三层交换机实现，可在线路两端分别接一台计算机，并将IP地址分别设为本端三层路由交换机的广域网接口地址，使用“ping 对端计算机地址 -t”命令进行测试。
    若是上述测试没有发生丢包现象，则说明线路运营商提供的线路是好的，引发故障的缘由在于用户自身，须要进一步查找。
    若是上述测试发生丢包现象，则说明故障是由线路供应商提供的线路引发的，须要与线路供应商联系尽快解决问题。
    由物理线路引发的丢包现象还有不少，如光纤链接问题，跳线没有对准设备接口，双绞线及RJ-45接头有问题等。另外，通讯线路受到随机噪声或者突发噪声形成的数据报错误，射频信号的干扰和信号的衰减等均可能形成数据包的丢失。咱们能够借助网络测试仪来检查线路的质量。
●网络拥塞
    网络拥塞形成丢包率上升的缘由不少，主要是路由器资源被大量占用形成的。
    若是发现网速慢，而且丢包率呈现上升的状况，这时应该show process cpu和show process mem，通常状况下发现IP input process占用过多的资源。接下来能够检查fast switching在大流量外出端口是否被禁用，若是是，则须要从新使用。
    再看一下Fast switching on the same interface是否被禁用，如一个接口配有多个网段而且这些网段间流量很大时，路由器工做在process-switches方式，这种状况下要在接口上执行命令“enable ip route-cache same-interface”。
    接下来，用show interfaces和show interfaces switching命令识别大量包进出的端口。一旦确认进入端口后，打开IP accounting on the outgoing interface看其特征，若是是***，源地址会不断变化可是目的地址不变，能够用命令“access list”暂时解决此类问题（最好在接近***源的设备上配置），最终解决办法是中止***源。
    应用中遇到的形成网络拥塞的状况还有不少，如大量的UDP流量，能够用解决spoof attack的步骤解决此问题。大量的组播流、广播包穿越路由器，路由器配置了IP NAT而且有不少DNS包穿越路由器等。上述状况形成网络拥塞后，通讯双方采起流量控制，丢弃不能传输的包。

●图6

【全文end】