Skip to main content

 路由器设置 > 路由器问答 >

巧用北塔BTNM网管系统解决网络环路故障

2012-10-14 00:08 浏览:

星期三早上上班之后,接到一客户信息中心主任的电话,反映他单位的网络出现问题,局域网内部电脑互ping丢包严重,ping网关的丢包率超过60%,ping本网段或跨网段都出现类似的丢包,严重影响到了企业的生产业务,情况非常紧急,请求过去帮忙解决处理。

于是我稍作收拾就立刻赶到了现场,快速安装上北塔BTNM网管系统的试用版。打开北塔BTNM后,发现有多个接入交换机的CPU负载告警,CPU负载竟然达到了60%以上了,打开物理拓扑图发现CPU高负载的设备都是以红色图标展现在眼前。 根据以往经验判断,出现这样的问题,一般有两种可能:ARP病毒和网络环路。开始进入故障排查:

1、排查是否ARP病毒

使用北塔数据流分析探针对数据包进行分析统计,ARP报文正常(非常低),同时数据流分析探针默认的网络扫描告警、帧流量异常告警和IP协议端口数使用异常告警这三项重要的监控项并没有发生告警。因此,可以排除ARP病毒发作的可能性。

2、排查是否内网环路

局域网环路发生故障通常有以下两个特点:

特点一,接入层交换机的CPU负载比较高。因为局域网出现环路后,广播报文会被环路上进行扩散,导致CPU性能比较低的接入层交换机的负载较高。

特点二,交换机的接口会在短时间内收/发大量的广播报文,通过交换机的接口统计信息确认环路发生的具体端口。

通过北塔BTNM网管系统的CPU负载告警和物理拓扑中的红颜色的设备(CPU高负载)情况与上述两个特点很匹配,到此判断是局域网环路引起的网络故障。那么既然知道了故障原因,接下来就着手来解决:

首先对物理拓扑图中20多个红颜色(CPU负载较高)的设备进行右键关联菜单中的的设备端口状态分析,经过将近10分钟的时间,发现其中一台华三的S3126的交换机中的Ethernet1/0/1和Ethernet1/0/2这个两个端口的广播包比率大,每秒端口流量大,同时广播包增长快速。

于是在北塔BTNM物理拓扑图中打开此设备的真实面板图,点中Ethernet1/0/2端口,右键将此端口关闭后,发现网络突然就好了。那么判断此端口就是罪魁祸首,到机房查看此交换机物理连接情况。发现同一根网线插在了这台交换机的两个端口,立马拔掉此网线,并重新开启Ethernet1/0/2端口,网络恢复正常。

经过此次的故障处理,发现北塔BTNM网管系统,可以通过图形化的方式快速定位问题所在,有效的帮助我们分析问题和解决问题,灵活运用将进一步提高IT运维管理。