关于 ip 端口监测的一点思路
2020-08-21 本文已影响0人
cloudFans
线上有ceph 对象存储集群以及ceph 块存储集群
定位一个nas nfs 挂载时而可以 时而不可以的问题
- 首先ip 和 ssh 端口是通的,证明网络没有问题
但是 有观察到 445(cifs、smb) 113 2049 (nfs) 时而不通,时而通
- 所以就直接登录到vip节点清理 iptable -F,确认iptables完全没有限制,之后,nfs对应的端口就可以通了,但是过了一天之后又不通了
- 基于arp 去检测,没有冲突的IP
- 最后所有存储检测了一下ip,确实是ip 冲突的,修改了ip
所以对于大型集群,一定要有一个ip管理的工具