wgcloud运维监控工具

WGCLOUD运行一段时间主机下线问题的处理过程

2021-06-26  本文已影响0人  王逅逅_f6c0

如果之前所有监控主机都正常上报数据,处于正常监控状态,监控主机各种性能指标上报正常,突然发现一部分或全部主机都下线了,不用担心,这种问题一般是server主机的守护进程(wgcloud-daemon-release)没有启动或守护进程端口(9997)没有开放给监控主机访问导致的

WGCLOUD是一款新型运维监控系统,具有自动化,易部署,易使用,轻量高性能等特点

排查问题:
1.在agent监控主机使用命令:telnet server主机IP 守护进程端口(默认9997),观察测试结果是否正常ping通,如果不通,则去看下守护进程(wgcloud-daemon-release)是不是没有启动,或者守护进程端口(默认9997)由于防火墙等原因没有开放给监控主机访问

2.还有一种可能是在server端修改了守护进程的端口,但是没有在agent端修改守护进程端口,两边端口不一致,导致agent一直用旧的守护进程端口,最终导致防篡改校验失败达到最大值,停止上报数据

守护进程端口修改说明:http://www.wgstart.com/help/docs10.html

如下图,红色IP标识已经下线

image.png
上一篇下一篇

猜你喜欢

热点阅读