微服务注册中心使用Nacos替换Eureka方案
一、概述
此文用于指导从Eureka切换成Eureka方案推荐
Nacos介绍与作为注册中心与Eureka对比链接:https://www.jianshu.com/p/afd7776a64c6
二、Nacos安装部署
推荐使用集群部署
2.1集群部署架构图
因此开源的时候推荐用户把所有服务列表放到一个vip下面,然后挂到一个域名下面
http://ip1:port/openAPI 直连ip模式,机器挂则需要修改ip才可以使用。
http://VIP:port/openAPI 挂载VIP模式,直连vip即可,下面挂server真实ip,可读性不好。
http://nacos.com:port/openAPI 域名 + VIP模式,可读性好,而且换ip方便,推荐模式
deployDnsVipMode.jpg2.2 安装Nacos
可以通过源码和发行包两种方式来获取 Nacos。
从 Github 上下载源码方式
git clone https://github.com/alibaba/nacos.git
cd nacos/
mvn -Prelease-nacos clean install -U
ls -al distribution/target/
// change the $version to your actual path
cd distribution/target/nacos-server-$version/nacos/bin
下载编译后压缩包方式
您可以从 最新稳定版本 下载 nacos-server-$version.zip
包。
unzip nacos-server-$version.zip 或者 tar -xvf nacos-server-$version.tar.gz
cd nacos/bin
2.3. 配置集群配置文件
在nacos的解压目录nacos/的conf目录下,有配置文件cluster.conf,请每行配置成ip:port。(请配置3个或3个以上节点)
# ip:port
200.8.9.16:8848
200.8.9.17:8848
200.8.9.18:8848
2.4. 配置 MySQL 数据库
生产使用建议至少主备模式,或者采用高可用数据库。
初始化 MySQL 数据库
application.properties 配置
2.5. 启动服务器
Linux/Unix/Mac
启动命令(在没有参数模式,是集群模式):
sh startup.sh
三、改造内容
以SpringCloud项目为例
3.1 maven依赖改造
首先去除Eureka相关依赖
<dependency>
<groupId>org.springframework.cloud</groupId>
<artifactId>spring-cloud-starter-alibaba-nacos-config</artifactId>
<version>0.2.1.RELEASE</version>
<!-- 这里排除springcloudnacos自带的nacos clinet-->
<exclusions>
<exclusion>
<groupId>com.alibaba.nacos</groupId>
<artifactId>nacos-client</artifactId>
</exclusion>
</exclusions>
</dependency>
<dependency>
<groupId>org.springframework.cloud</groupId>
<artifactId>spring-cloud-starter-alibaba-nacos-discovery</artifactId>
<version>0.2.1.RELEASE</version>
<exclusions>
<exclusion>
<groupId>com.alibaba.nacos</groupId>
<artifactId>nacos-client</artifactId>
</exclusion>
</exclusions>
</dependency>
<!-- 使用最新版本的的nacos clinet-->
<dependency>
<groupId>com.alibaba.nacos</groupId>
<artifactId>nacos-client</artifactId>
<version>最新版本</version>
</dependency>
先把eureka相关依赖删除,再把spring-cloud-starter-alibaba-nacos里面的nacos-clinet相关的依赖排除,使用client对应版本的nacos。
3.2 配置文件改造
由于配置中心优先级问题,配置中心配置参数需要写在bootstrap.properties里面
在bootstrap里增加如下:
spring.cloud.nacos.config.server-addr=127.0.0.1:18847
spring.cloud.nacos.config.namespace=9f288251-7c62-4041-b816-63e1a4b54112
spring.cloud.nacos.config.group=XXXXX
其中server-addr为nacos的地址,namespace为nacos控制台配置的相应环境对应的编码(dev/test/gray/produce),涉及到springboot启动初始化组件的顺序,配置中心相关初始化数据必须放在bootstrap.properties
更改application-XXX.properties
spring.cloud.nacos.discovery.server-addr=127.0.0.1:18847
spring.cloud.nacos.discovery.namespace=9f288251-7c62-4041-b816-63e1a4b54112
其中server-addr为nacos的地址,namespace为nacos控制台配置的相应环境对应的编码(dev/test/gray/produce)
3.3 更改项目主类注解
更改springboot主类的@EnableEurekaClient
注解,更改为SpringCould原生注解@EnableDiscoveryClient
3.4 日志文件改造
由于目前Nacos心跳日志等日志较多,建议把nacos包的日志单独打印或者打印warn级别以上的,info级别的参考配置如下,指定com.alibaba.nacos日志输出到目录${LOG_DIR}/${INFO_DIR}/${app_id}-nacos-info.log
,也可以配置成warn级别
<!--nacos-->
<appender name="RollingFile-INFO-Nacos-Appender" class="ch.qos.logback.core.rolling.RollingFileAppender">
<filter class="ch.qos.logback.classic.filter.LevelFilter">
<level>INFO</level>
<OnMatch>ACCEPT</OnMatch>
<OnMismatch>DENY</OnMismatch>
</filter>
<file>${LOG_DIR}/${INFO_DIR}/${app_id}-nacos-info.log</file>
<rollingPolicy class="ch.qos.logback.core.rolling.TimeBasedRollingPolicy">
<fileNamePattern>${LOG_DIR}/${INFO_DIR}/${app_id}-nacos-info.%d{yyyy-MM-dd}.gz</fileNamePattern>
</rollingPolicy>
<encoder>
<pattern>[%d{yyyy-MM-dd HH:mm:ss.SSS}]\t${ip}\t${app_id}\t%le\t[%t]\t%lo\t%M\t%L\t[%m]%n</pattern>
<charset>utf8</charset>
</encoder>
</appender>
<appender name ="ASYNC-INFO-Nacos" class= "ch.qos.logback.classic.AsyncAppender">
<!-- 不丢失日志.默认如果队列的80%已满,则会丢弃TRACT、DEBUG、INFO级别的日志 -->
<discardingThreshold>0</discardingThreshold>
<queueSize>10240</queueSize>
<includeCallerData>true</includeCallerData>
<appender-ref ref ="RollingFile-INFO-Nacos-Appender"/>
</appender>
<logger name="com.alibaba.nacos" level="INFO" additivity="false">
<appender-ref ref="Console-Appender"/>
四、Nacos替换Eureka后的上线方案
4.1 阶段一:测试阶段
操作步骤:在测试阶段,首先搭建Nacos集群,创建若干个测试demo项目,互相调用,以确定模板。对各服务进行改造,在测试环境机器部署各服务,进行测试。
验收标准:各中心互相使用feign调用成功,各中心在注册中心上线下线状态以及路由正确性。
应急和回滚方案:查找问题,继续重试,有无法解决的问题暂时回滚测试环境
风险分析:无风险
4.2 阶段二:灰度阶段
操作步骤:首先把线上环境的Nginx对应解析去除与Nacos服务器上gw的映射关系。对线上服务器: 进行服务下线操作(停线程池等)并备份,在以上机器的服务部署灰度环境用的nacos注册中心的包。部署完毕后以Nacos注册的gw为入口,对服务进行简单测试。(停用线程池,测试不涉及在线业务相关)
验收标准:Nacos集群各中心互相使用feign调用成功,各中心在注册中心上线下线状态以及路由符合正常逻辑。涉及微服务间调用的功能正常
风险分析:Eureka集群承受全部流量,可用性降低低,建议这个阶段快速测试。
应急和回滚方案:查找问题,继续重试,如果解决不了问题则下线Nacos集群服务,启动操作步骤里备份的Eureka服务
4.3 阶段三:金丝雀测试
操作步骤:在Nginx入口处分出一小部分流量到Nacos集群的GW并开启线程池。观察Nacos集群中各中心的日志是否有异常情况出现。测试过程中可以逐渐增加到naocs-gw的流量。观察一个星期。
验收标准:Nacos集群各中心日志正常,Nacos微服务间调用无异常情况出现,订购可以成功,文件服务功能正常。
风险分析:Nacos集群可能出现不明问题,最严重的情况回影响Nacos集群服务之间的调用
应急和回滚方案:如果发现有严重问题,马上联系运维切断Nginx到Nacos集群GW的流量,并关闭线程池,即如图二的集群状态。回到阶段二步骤测试、验收或者回滚。
4.4 阶段四:流量全切到Nacos集群
操作步骤:在金丝雀测试之后确定服务完全稳定了,把Nginx的流量全量切到nacos的gw,这时候全部的流量通过Naocs集群。观察若干小时后对原Eureka集群服务进行下线操作(包含停线程池等操作),并备份(相当于冷备)。
验收标准:Nacos集群各中心日志正常,Nacos微服务间调用无异常情况出现,订购可以成功,文件服务功能正常。
风险分析:这个阶段Nacos集群为单机模式承受全部流量。可能会有之前未发现的问题,如有异常及时按照应急回滚方案操作。建议在流量较少的时候施工
应急和回滚方案:如果发现有处理不了的故障,马上联系运维启动Eureka集群,并把nacos-gw的流量切断改为把流量代理到eureka-gw,恢复到阶段二的状态。查找问题,解决问题并重新测试,按照阶段流程来操作。
4.5 阶段五:Nacos剩余服务实例上线
操作步骤:在原Eureka服务器上部署Nacos服务如图五所示,待服务全部起来后,nginx的流量在两台gw中负载均衡。
验收标准:Nacos新增集群和原来的集群各中心日志正常,Nacos微服务间调用无异常情况出现,订购可以成功,文件服务功能正常。
风险分析:暂无,待补充
应急和回滚方案:如果发现有较严重问题,下线新上线的注册Nacos的服务,切断到nacos-gw的流量,回退到阶段四。