网络故障排除过程(2)
1.2.3 列举可能导致错误的原因
接下来,我们要做的就是列举所有可能导致故障现象的原因了。网络管理员应当考虑,导致无法浏览Web的原因可能有哪些呢?网卡硬件故障、网络连接故障、网络设备故障、TCP/IP协议设置不当等。在这个阶段不要试图去找出哪一个原因就是问题的所在,只需尽量多地记录下自己所能想到的,而且是可能导致问题发生的原因就可以了。也可以根据出错的可能性把这些原因按优先级别进行排序。注意,千万不要忽略其中的任何一个细节。
1.2.4 缩小搜索范围
必须采用有效的软硬件工具,从各种可能导致错误的原因中一一剔除非故障因素。对所有列出的可能导致错误的原因逐一进行测试,而且不要根据一次测试,就断定某一区域的网络是运行正常或是不正常。另外,也不要在自己认为已经确定了的头一个错误上停下来,而不再继续测试。因为此时既可能是搞错了,也有可能存在的错误不只一处。所以,应该使用所有可能的方法来测试所有的可能性。
除了测试之外,还要注意做以下几件重要的事情,①千万不要忘记去看一看网卡、交换机和路由器面板上的LED指示灯。通常情况下,绿灯表示连接正常;红灯表示连接故障;不亮表示无连接或线路不通;长亮表示广播风暴;指示灯有规律地闪烁才是网络正常运行的标志。②千万不要忘记去看一看服务器、交换机或路由器的系统日志,因为在这些系统日志中,往往记载着产生的错误以及错误发生的全部过程。③如果有幸拥有并安装了诸如CiscoWorks、HP OpenView之类的网络管理软件,千万不要忘记用它来检查一下哪些设备出现了问题。由于这些网络管理软件往往具有图形化的用户界面,因此,交换机各端口的工作状态可以一目了然地显示在屏幕上。更进一步,许多网络管理软件还具有故障预警和报警功能,从而可以缩小网络故障排查的搜索范围。
当然,在这一步骤中最不能忘记的还是要记录下所有的观察及测试的手段和结果。
1.2.5 隔离错误
经过反复地测试,此时也搞清楚了到底是哪一部分故障导致了问题的发生,并最终确定很有可能是计算机出错了。于是,便开始检查该计算机网卡是否安装好、TCP/IP协议是否安装并设置正确、Web浏览器的连接设置是否得当等一切与已知故障现象相关的内容。然后,剩下的事情就是排除这个故障了。此时,由于对所发生的故障已经有了充分的了解,那么,故障排除也就手到擒来了。但是,不要就此匆忙地结束工作,因为还有更重要的事情等着去做。
1.2.6 故障分析
处理完问题之后还有什么要做呢?必须搞清楚故障是如何发生的,是什么原因导致了故障的发生,以后如何避免类似故障的发生,拟定相应的对策,采取必要的措施,制定严格的规章制度。
对于一些非常简单明显的故障,上述过程看起来可能会显得有些繁琐。但对于一些复杂的问题,这却是必须遵循的操作规程。
最后,记录所有的问题,保存所有的记录!另外,经常回顾曾经处理过的故障也是一个非常好的习惯,这不仅是一种经验的积累,便于以后处理类似故障,而且还会启发管理员思考许许多多与此相关联的问题,从而进一步提高理论和技术水平。