记一次失败的发布过程
2021-05-12 本文已影响0人
翟志军
拖着沉重的身体回到宿舍,启动电脑,双眼干涩。打开Notion开始反省今天的发布过程。
很明显,这是一次失败的发布过程。
这个过程是这样的:
- 09:00 提交代码
- 09:05 Jenkins执行完成部署逻辑
- 09:09 应用滚动更新完成。同时我们也发现了问题
- 09:40 找出问题所在,修改配置代码,并提交代码
- 09:46 Jenkins执行完成部署逻辑,问题解决
- 09:49 测试团队开始测试
- 11:29 通过测试
整个过程耗时2个半小时。部署过程总耗时49分钟。其中,找问题过程耗时31分钟。
问题最终发现是出在一个istio的vs配置忘记修改了。也就是应用配置修改了,但是应用相关的路由忘记修改了。
我们应该如何避免下次出现这样的问题呢?
从两个方面下手:
- 启动调用链,可以加快找出问题速度。
- 避免忘记修改配置。
我认为应该优先从第2点下手。这是非常难的,配置项只会越来越多。如果没有智能化的提示,不管是使用界面的方式配置,还是使用代码的方式进行配置都会遇到同样的问题。
所谓的智能化提示,就是当你要修改配置的时候,存在一个系统会提示还有留意或者修改哪些其它的配置。
可是,具体如何做?现在已接近凌晨两点,大脑已经糊,下次再写。