实战网络故障

        这个星期蛮忙的,星期二和星期三要协助安全产品的厂商测试。星期三快下班的时候,公司的整个网络出现了问题,变得很是缓慢,内部的应用基本瘫痪。没办法,又得出演消防员这个角色了
        有问题,到机房!第一时间来到了机房,在监控机上看了一下,网络使用率打到60%-80%,怪不到卡死了。后悔啊,没把那个监控交换机和路由器的软件挂着,看不到以前的数据,惟有使用最原始的方法判断问题所在了。先简单介绍一下公司的网络拓扑,核心交换机下有七台智能交换机,智能交换机下链接非智能的交换机,实现了多主机的接入。初步判断是主机或者是非智能交换机的问题。要快速定位故障,用了插拔法。分别把每一个智能交换机到核心交换机的端口断开,一分钟内就找出了出现故障的交换机。
       故障定位了,就处处理的阶段了。把问题的交换机连上,登录上去,先把登录外的其余端口所有down掉。而后,查看日志,或许是由于出现了故障的缘由,交换机上的日志只有登录后down掉端口的信息,其余的都没了。怎么办?不急,咱们再来查看一下每一个端口的状态,看一下每一个端口的错误报告和数据包的状况。48个端口一个个看,来了,来了,其中有几个端口广播包特别多,有一个更多到“疯狂”的地步,43亿!!!要是我有这么多人民币就行了!哈哈!先把可能有问题的端口记下来,把其余没问题的端口开启,没问题,好的!可能有问题的端口一个一个开,43亿的那个最后开。前几个都没问题,43亿的那个一上来就有问题了。立马把它down掉,而后到现场查线。顺藤摸瓜,终于找到了问题所在。一个非智能交换机上有一条线的两头都插在交换机上面的,造成环路,形成大量广播,致使网络瘫痪。把那个线拔下来,端口再up起来。没问题了!!现场的状况是非智能交换机的端口有多的,并且是挂在墙脚附近,比较低,并且网线到位了,电脑没所有到位,有多的网线,就连到桌面上放在那里,估计是那里的人看到有一根网线的水晶头掉到地上,看到交换机上有口,顺手就插上去了,好心干了坏事。
        此次故障是解决了,可是也给了我提醒,监控软件要用好,挂在那里,有问题了能够准肯定位。工做上要学习的事情还多呢。努力啊!
相关文章
相关标签/搜索