CDH集群更换IP处理方法
注:该文档适用于CDH集群中,节点Ip地址发生变化,集群无法正常启动的场景
首先停止CDH集群
在各个节点上,停止尚在运行的CDH服务
1、master节点上停止以下服务
systemctl stop cloudera-scm-server
systemctl stop cloudera-scm-agent
2、slaves节点上停止的服务:systemctl stop cloudera-scm-agent
3、修改CDH集群中IP为新的IP,cm库hosts表中

4、配置各节点物理IP地址
vim /etc/sysconfig/network-scripts/ifcfg-ens192

5、修改各节点Hosts映射
vim /etc/hosts

6、修改NTP服务
vim /etc/ntp.conf
master上:

slaves上

最后执行 Service ntpd restart 同步各节点时间
7、配置各节点agent中对应的ip(最重要一点,否则各个slave节点无法与master节点通信)
修改每个节点上:vi /etc/cloudera-scm-agent/config.ini
修改server_host的值(这个是指定cloudera-scm-server的ip)

8、启动CDH集群
Scm-server节点
service mysqld start(如果无法启动进行操作:vim /etc/my.cof mkdir /var/run/mysqld/ chown mysql.mysql /var/run/mysqld/)
systemctl restart cloudera-scm-server
systemctl restart cloudera-scm-agent
Scm-agent节点
systemctl restart cloudera-scm-agent
如果尚未正常启动,需要重新分配并激活Parcel中的 CDH


ps: 如果启动了HDFS HA机制,此时有可能HDFSD Client会链接到了Standy节点 而非Active; 最简单的办法就是直接关闭HDFS HA;即可恢复。 如果还想恢复HA,直接在重新开启(重新开启为推断,尚未具体验证)