不同阶段的稳定性提升方式简单记录
2024-12-01 本文已影响0人
wwq2020
概述
提升稳定性主要是两件事
1 提高mtbf
2 减少mttr
提高mtbf
基础
制定技术规范,研发流程标准化
编码前阶段
如架构,sli选择等设计方案进行评审
编码阶段
单元测试,code review,结对编程等
测试阶段
一般测试
接口测试,ui测试,压力测试
稳定性测试
混沌工程
安全性
安全测试
发布前
提高观测性(metrics/log/trace/profile/event,),可监控,可告警,可灰度,可回滚,有预案,,应急响应,容量评估,故障演练,故障自愈,变更管控,error budget
减少mttr
事前
提高观测性(metrics/log/trace/profile/event,),可监控,可告警,有预案,有预案,应急响应,故障自愈
事中
事故指挥系统
事后
事故管理,事后复盘