交换机特殊故障分析及解决方法
故障一:环路问题
这个故障发生在一个学生计算机机房,共有65台计算机(一台教师机、64台学生机)。所有计算机使用三台堆叠的某品牌的国产交换机接入网络。某天上课时教师发现,所有的计算机(都使用WINDOWS98操作系统)都不能上网,而且计算机也变得很慢,连鼠标动起来都很慢。据了解,前一天上最后一课时,还都正常的,而第二天上午上第一节计算机课时,就不行了。在昨天最后一课到第二天最早一课这段时间内没有人用过机房,除了清洁工。
从对了解到的情况分析,计算机设置或者中毒的可能性不大。因为除教师机外,所有的学生机都安装了硬盘保护卡,重启计算机后都会自动还原。唯一会中毒的,就是教师机了。经过教师机的杀毒软件升级并查毒后,也没有发现病毒。而且把计算机的网线拔掉后,系统就运行正常了。网线一插上,系统又变慢。即使交换机重启后,也没有用。
现在的重点怀疑对象就是所有计算机共同使用的交换机了。会不会是交换机的故障呢?来到设备间,观察三台交换机的状态,所有端口的ACT(ACTIVE)指示灯亮着,但不闪烁。从产品说明书上得知,这种状态说明有可能是网络中存在环路,如果要避免环路,启用STP协议即可。仅仅这样观察,也看不出哪里有什么毛病,索性登录上去看个究竟。把笔记本(使用WINDOWSXP操作系统)的网卡用一根直连线接上主控交换机(COMMANDER)的其中一个端口,使用常用的WEB管理方式登录交换机,但是出现连接超时现象,没有出现系统变慢的情况。这个现象应该和机房的学生机一样,只不过学生机是WIN98,对此故障的反应有所区别。而今只有通过厂商提供的CONSOLE电缆建立超级终端了。成功联机后登录交换机,速度也很慢,每发出一个指令,大概需要5-6秒钟才能给出回应。
就这样,勉勉强强的在交换机上找到了STP选项,结果发现这三台交换机的STP均未启用。如果启用STP后,能够消除故障现象,则说明网络中真是存在网络环路。接着又花了一段时间启用了交换机的STP功能。故障真的消失了。
现在问题已经明确,网络中肯定存在环路,从而导致广播风暴或者MAC地址表不稳定等问题,影响网络中数据的正常传输。如果启用STP,虽然能够防止环路的产生,但启用STP后,会消耗交换机的系统资源,一定程度上会降低效率。一般情况下,出于要保证网络链路的稳定性,出了正在使用的链路外,设置了另外的连接以作备份。这种情况需要启用STP防止环路的出现。而在这个单独的机房,没有必要设置备份链路。所以最好要找到导致环路的原因,取消STP功能。那怎么找出环路所在呢?
把机房的所有计算机关闭,且关闭电源。这样计算机网卡上就没有电了,相连接的交换机的端口也就不会亮了。到了设备间后,发现主控交换机上的18端口和21端口同时亮着,这就表明18和21这两个端口被连接并形成回路。赶忙找来施工布线图,经查得知,这两个端口所连接的模块正是教师机桌子下面的其中两个。再回到学生机房,看到教师机的桌子下共有4个模块,教师机只是使用了其中的一个模块,而且又有一根直连线连接着其中的另外两个。本来这根直连线是作为教师机的备份连线使用的,其中一端已经连接在模块上,另一端没有接任何设备。估计是清洁工在打扫卫生时,以为自己碰掉了一根网线,所以故作聪明的将该线的另外一端插进了一个未使用的模块中。就是这一个小小的错误,让我忙活了半天的时间。
从这个故障排除的过程来看,我们在面对各种故障现象时,如果遇到多种可能,尽量通过仔细分析,排除较小的可能,以最快的速度来定位故障、解决故障。
故障二:系统默认导致的故障
某公司为了升级网络设备,将原来的某A品牌接入交换机更换为B品牌的交换机。而升级后却发现除部分使用固定IP地址的计算机能够正常上网外,其他使用DHCP获得地址的计算机均不能成功获得IP地址。原来使用DHCP的计算机如果改为固定IP,则可以上网。而在升级之前,均没有问题。需要说明的是,所有计算机的操作系统都是Windows98。
在网络升级时遇到的问题,通常是新产品和原先没有升级的设备的兼容性问题。由于这次升级只是更换了交换机,所以我们就可以集中在交换机上进行故障分析。为了排除交换机外部因素的干扰,我们首先检查了DHCP服务器,因为理应通过动态分配而得到地址的计算机却不能正常得到。经过仔细的对DHCP服务器的检查后,没有发现任何故障。
检查交换机的各项配置、MAC地址表、ARP表,也没有发现异常现象。排障处于停顿状态。无计可施的情况下,拨通了产品供应商的电话。笔者在咨询了产品工程师后得知,交换机的端口开机后,有一个从Bloking(阻断)、Listening(监听)、Learning(学习)到Forwarding(转发)这几个状态的转换过程。也就是说交换机端口并不是一连接上计算机就立即处于转发状态。而错误就可能出现在这里,因为Windows98的计算机在启动时,需要发送数据给DHCP,进行地址租用,此时的交换机端口却是Bloking状态而不能通信,故不能成功分配到IP地址。
如果要防止此类问题的再次出现,可以有一个解决方法。那就是改变该型交换机的端口设置,使之一加电,就处于转发状态。这个设置只需要在管理窗口中,添加一个相应的命令即可。
交换机常见故障分析及解决方法
故障1:交换机刚加电时无法通信
现象:交换机刚刚启动时无法连接至其他网络,需要等待一段时间才可以。另外,需要使用一段时间之后,访问其他计算机的速度才快,如果有一段时间不使用网络,再访问时速度又会慢下来。
分析:由于这台交换机是一台网管交换机,为了避免网络中存在拓扑环,从而导致网络瘫痪,可网管交换机在默认情况下都启用生成树协议。这样即使网络中存在环路,也会保留一条路径,而自动切断其他链路。所以,当交换机在加电启动的时候,个端口需要依次进入监听、学习和转发状态在,合格过程大约3-5min时间。
解决:如果需要在交换机加电之后迅速实现数据转发,可以禁用扩展树协议,或者将端口设立之为PortFast模式,不过需要注意的是,这两种方法虽然省略了端口检测过程,但是一旦网络设备之间产生拓扑环,将导致网络通信瘫痪。
故障2:5口交换机智能使用4口
现象:办公室中有4台计算机,但是只有一个信息插座,于是配置了一台5口(其中一口为uplink端口)交换机。原以为4台计算机刚好与4个接口连接,1个uplink端口用于连接到局域网,但是接入到网络之后,与uplink端口相邻的1号口无法正常使用。
分析:uplink端口不能被看作是一个单独的端口,这是因为它与相邻端口其实就是一个端口,只是适用的连接对象不同而已。借助uplink端口,集线设备可以使用直通线连接至另外一个集线设备的普通端口,这样就不需要交叉线了。
交换机和集线器的芯片通常是*4,所以集线设备端口大多为4口、8口、16口、24口等,如果制作成5口,就会浪费3个模块,从而增加成本。
解决:将4口交换机换成8口
网管型交换机
故障3:“COL”指示灯不亮或不断闪烁,无法实现通信
现象:局域网中计算机通过集线器访问服务器,但是某日发现所有客户端计算机无法与服务器进行连接,客户机之间ping也时断时续。检查集线器发现“COL”等不断闪烁,表明冲突发生;“COL”灯长亮则表示有大量冲突发生。导致冲突大量发生的原因可能是集线器故障,也可能是网卡故障。一般情况下,网卡出现的故障的可能性较小,因此将重点放在对集线器的排除方面。
解决:更换集线器,网络恢复正常。
故障4:升级至千兆网络之后,服务器连接时断时续
现象:原先服务器采用10/100mbit/s网卡,运行一切正常。但是安装了一款1000mbit/s网卡,用其连接至中心交换机的1000base-t端口之后,服务器与网络的连接时断时续,连接极不稳定,无法提供正当的网络服务。使用网络测试仪测试网络,发现双绞线链路的连通性没有问题。
分析:在100mbit/s时连接正常,只是在升级到1000mbit/s时才发生故障,看来导致这种故障的原因可能是超五类布线问题。虽然从理论上说超五类系统支持1000mbit/s的传输速率,但是如果双绞线、配线架、网线和其他挽留过设备的品质不好,或者端接工艺有问题,就仍然无法实现1000mbit/s带宽。
由于1000base-t需要使用双绞线全部的4对线,每对线的有效传输速率为250mbit/s,并完成全双工传输,因此1000base-t对双绞线的信号衰弱减、回波、返回损耗、串音和抗电磁干扰等电气性能有了更高的要求。如果双绞线或者其他配件的性能不好,就会在线对间产生严重串扰,从而导致通信失败。
解决:考虑到五类布线系统的性能有可能无法满足千兆网络系统,因此更换为六类线布线产品故障解决。
故障5:尽管link灯不停闪烁,但网速奇慢
现象:服务器上网速度很慢,开始时打开网页很缓慢,后来甚至连网页都无法打开,ping网站也无法解析地址。起初以为是DNS设置或者服务器故障,但是这些都在正常运行。尝试ping其他计算机,发现丢包率高很高。而此时交换机的link指示灯不停闪烁,数据的交换非常频繁,说明计算机在不停发送和接收数据包。关闭交换机之后再重新打开,故障现象得到缓解,但是一段时间之后又出现这种故障。
分析:从故障现象来看,这是网络内的广播风暴。广播风暴的产生会有很多原因,比如蠕虫病毒、交换机端口故障、网卡故障、链路冗余而没有启用生成树协议、网线线序错误或者受到干扰等。在网络故障发生的时候查看交换机指示灯是一个很便捷的判断方法,可以直观产看网络连通性和网络流量。
解决:就目前来看,蠕虫病毒是造成网络瘫痪的最重要的原因,及时为服务器更新系统补丁,并且安装网络版本的病毒查杀软件,及时为服务器升级病毒库,在服务器安装防防病毒客户端程序之后,故障得以解决。
PoE交换机
故障6:服务器资源共享故障
(1)无法将访问权限指定给用户
现象:整个网络使用的是Windows域,客户端是Windows2000 professional。服务器的IP设置为192.168.1,DNS是127.0.0.1,路由器的内部IP地址是192.168.0.1.客户端全部采用自动获取IP地址方式,并且同属于domainuser组。在服务器设置共享文件的时候,虽然可以指定权限,但是无法访问。
分析:在Windows域中,都是使用NTFS权限和共享权限来设置共享文件夹的访问权限。不过NTFS权限是高于共享文件夹权限的,也就是说必须先为欲设置为共享的文件夹设置NTFS权限,然后再为其设置共享文件夹权限。如果两者冲突,那就需要将以NTFS权限为准。
解决:先为用户指定NTFS权限,然后再指定共享文件夹权限。例如需要给用户A创建一个共享文件夹TESTA,使该共享文件夹能够被用户A完全控制,而被其他任何用户访问,就要先设置TESTA的访问权限,为用户A指定“完全控制”权限,而为everyone设置“只读”权限,在设置共享文件夹权限的时候也要这样设置。
(2)共享文件夹无法显示在“网上邻居”中
现象:已经共享了某些文件夹,但是在“网上邻居”中无法查看,但是同一计算机的有些共享文件又能看到。
分析:既然有些共享文件夹可以看见,说明该计算机的网络配置和连接基本正弘城下那个。而且这其实并非一个故障,而是属于共享属性的一种配置类型。在Windows系统中,共享文件类型主要有两种,一种是供系统调用的;另外一种是供其他用户访问的,供系统调用的共享文件是不在“网上邻居”中出现的,但是可以用诸如“net view”之类的命令显示;供其他用户访问的共享文件是可以在“网上邻居”中看到的。
解决:将共享文件名后的“$”符号删除的,不能显示的共享文件就可以在“网上邻居”中现了。
故障7:集线器和路由器无法共享上网
现象:多台计算机采用宽带路由器和集线器方式,利用集线器扩展端口组网共享Internet。连接完成后,直接连接至带宽路由器LAN口的3台机器能上网,而通过集线器连接的计算机却无法上网,路由器与及期限之间无论采用交叉线或平行线都不行,且集线器上与路由器LAN端口连接的等不良。另外,集线器上的计算机无法ping通路由器,也无法ping通其他计算机。
分析:
(1)集线器自身故障
故障现象是集线器上的计算机彼此之间无法ping通,更无法ping通路由器。该故障所影响的只能是连接至集线器上的所有计算机。
(2)级联故障
例如路由器与集线器之间的级联跳线采用了不正确的线序,或者是跳线连通性故障,或者是采用了不正确的级联端口。故障现象是集线器上的计算机之间可以ping通,但无法ping通路由器。不过,直接连接至路由器LAN端口的计算机的Internet接入将不受影响。
(3)宽带路由器故障
如果是LAN端口故障,结果将与级联故障类似:如果是路由故障,结果将是网络内的计算机都无法接入Internet,无论连接至路由器的LAN端口,还是连接至路由器。
解决:从故障现象上来看,连接至集线器的计算机既无法ping通路由器,也无法ping通其他计算机,初步断定是计算机至集线器之间的连接故障。此时可先更换一根网线试试,如果依然无法排除故障,则可以更换集线器解决。
故障8:IP地址冲突
现象:最近我的计算机经常出现下面情况,提示“系统检测到IP地址和网络硬件地址00 05 3B 0C 12 B7发生地址冲突”。此系统的网络操作可能会突然中断,然后就掉线1min左右又恢复连接。这是什么原因?
分析:这种系统提示是典型的IP地址冲突,也就是该计算机采用的IP地址与同一网络中另一台计算机的IP地址完全相同。从而导致通信失败。与该就三家发生冲突的网卡的MAC地址是“00 05 3B 0C 12 B7”。通常情况下,IP地址冲突是由于挽留过管理员IP地址分配不当,或其他用户私自乱设IP地址所造成的。
解决:由于网卡的MAC地址具有唯一性,因此可以请网管借助于MAC地址查找到与你冲突的计算机,并修改IP地址,使用“IPCONFIG /ALL”命令,也就是可以查看计算机的IP地址与MAC地址。最后使用“ARP –S IP地址 网卡物理地址”的命令,将此合法IP地址与你的网卡MAC地址进行绑定即可。
好了,以上内容就是交换机组最常见的8大故障及解决方法,大家以后在交换机使用方面如果遇到以上问题,可以优先尝试我们提供的方法,一般情况下,都是可以解决的。