5.10路由器故障

5.10路由器故障

路由器往往位于网络边缘,用于实现网络与因特网以及其他网络之间的相互连接。因此,路由器的故障相对较为容易判断。也就是说,当整个网络都无法接入因特网或者无法实现与其他网络互联时,在排除了可能的广域网物理链路故障后,基本上可以判断为路由器故障。

路由器虽是硬件设备,但也有操作系统和配置文件问题,因此,其故障也分为两类,即硬件故障和软件故障。

1.电源故障

电源故障表现为当打开路由器的电源开关时,路由器前面板的电源灯不亮、风扇不转。这时要重点检查电源系统,看供电插座是否有电,电压是否在规定的范围内。如果供电正常,应该检查电源线是否完好,接触是否牢靠,必要时可以换一根电源线,如果还不行,可以判定问题出在路由器的电源上。

2.主板故障

主板故障表现为路由器能够正常加电,但系统无法正常引导至工作模式,所有接口的网络通信中断,路由器停止正常工作,或者循环重新启动,或者系统挂起,或者系统没有任何响应,甚至借助配置端口和超级终端,也无法登录至系统进行诊断和管理

3.模块故障

系统其他部分都能正常识别并正常工作,但却无法正确识别有故障的模块。或者,虽然模块可以被正确识别,但即使正确配置后,该模块上的所有接口仍然不能正常工作。此时,往往是因为模块存在物理故障。欲确认是否为模块故障,可以使用相同型号的完好模块替换怀疑有问题的模块,即以替换法进行故障诊断。

4.端口故障

在保证配置正确的情况下,当端口故障发生时,将只影响发生故障的端口通信,而路由器,甚至位于同一模块中的其他端口的正常通信不受影响。将其他同类型的端口修改为故障端口的配置进行替换测试,可以确认是否为端口故障。

5.硬件兼容性故障

路由器接口和模块的兼容性故障大量发生。该故障最明显的现象是安装的网络模块不能被系统检测到,或者模块不能正常工作,甚至会导致路由器的循环重新引导。

只需一些简单的操作步骤,就能够识别和确定兼容性故障。

在EXEC或特权EXEC模式下,使用show diag命令,可以检查网络设备的硬件信息,如果在show diag命令输出中没有显示模块硬件信息,则重新安装该硬件模块,也可以将该模块安装至不同的插槽上看是否正常。一些模块不支持热插拔,因此,网络模块的插拔应当在电源关闭的情况下进行。重新安装模块后,再重新引导路由器。

如果在show diag命令输出中显示有模块硬件信息,但是不能在show run命令或show ip interface brief命令输出信息中看到该模块接口,应检查硬件安装文档。一些模块需要在安装后重新配置路由器。

在show diag命令输出信息中,记录类似Unknown Wan daughter card或WIC module not supported/disabled in this slot的错误信息,表明相应插槽中的硬件不兼容。

6.系统故障

IOS作为路由器操作系统,保存在路由器Flash中。因为操作失误(如删除了Flash中的文件)或其他原因(如突然断电),可能会使Flash中的IOS丢失,从而导致路由器无法正常启动。如果路由器无法正常进入到用户模式,往往说明系统软件IOS存在问题。

发生故障时,可以使用保存在ROM中的备份操作系统软件。虽然该IOS通常会比Flash中的IOS版本稍微低一点,但完全可以使路由器继续工作。当路由器重新启动和工作后,必须重新将合适的IOS上传到Flash中。

7.配置错误

配置错误是最容易出现也是最难排除的故障。容易发生配置故障的地方有很多,例如,接口配置错误、路由协议配置错误、IP地址和掩码错误、ACL(访问控制列表)错误、修改配置后没有保存,重启后配置丢失等。其中,最容易出错的就是ACL。ACL可能的错误包括:

(1)错误应用了ACL端口。

(2)错误禁止了源地址、目标地址、端口号。

(3)ACL语句的顺序不恰当。

(4)列表最后没有Permit语句。

8.路由器故障诊断步骤

当发生路由器故障时,建议采用以下步骤诊断和排除故障:

(1)确定故障的具体现象,分析并列举所有可能导致该故障的原因。例如,路由器不能正常工作,原因非常多,可能是路由器文件系统丢失、配置文件错误、模块硬件故障、线路故障等。

(2)收集有助于隔离故障的信息,推断最有可能的故障原因。从网络管理系统、协议分析跟踪、路由器诊断命令的输出信息、路由器日志记录,以及厂商技术文档等资料中收集相关信息,并由此推断出可能的故障原因。

(3)制定诊断计划,从最可能导致故障的原因开始,借助各种诊断工具和诊断方法,逐一排除可能的故障原因,并最终定位故障。

(4)采取相应的措施,排除路由器故障。根据导致故障原因的不同,采用更换路由器硬件、修改配置文件、更新系统映像、恢复物理链路等方式,彻底排除故障。

(5)做好故障诊断排除记录。将故障现象描述、故障诊断和排除过程详细记录下来,并对故障做出点评,分析可能导致该故障的原因以及采取的避免措施和手段,以备日后查阅。