运维驿站

生产环境中的网络设备为何应该关闭debug

2020-10-19  本文已影响0人  爱看时事的通信崔

某公司的思科核心路由器每开启一段时间后,就会出现“路由进程中断,路由表项被撤回”的故障现象。公司安排专家对配置进行了检查,没有问题;又邀请厂家对设备硬件的运行状况进行了测试,也没有问题。那么是什么原因呢?

偶然的机会,某工程师在检查路由器配置记录表时(工程师配置设备留下的记录),发现故障是在一次用debug进行网络中断排错后频繁出现的。该工程师立刻关闭了设备的debug功能,路由器的故障竟然不再出现了。

什么是debug?

在解释故障原因前,先了解一下什么是debug。

写过代码的都知道,为了获取调试信息,往往会在代码中写出很多print。网络设备的debug和写代码时的print功能类似,就是把隐藏在网络设备系统和代码中的打印开关给打开了,进而输出所需的调试信息。

一般情况下,debug主要由如下字段构成:

时间戳 主机名 模块名/级别/信息摘要:内容

为什么debug会导致进程中断呢?

网络设备往往隐藏着大量打印开关,debug all则意味着打开了所有开关,设备就会输出海量的调试信息。每一条输出,都依赖于设备CPU的运算,随着时间的推移,一旦CPU被debug占用了99%,整个路由交换进程就会中断,表项条目就会被撤回,从而导致网络故障。

非要打开debug怎么办?

特殊情况下可能要求必须打开debug功能,我们有必要采取如下两个步骤:

debug ip ospf neighbor error # 调试ospf邻接错误
debug crypto ike session error 

总之,生产环境中的网络设备必须谨慎debug,防止网络故障。

上一篇下一篇

猜你喜欢

热点阅读