线上问题处理方法

2019-01-07  本文已影响0人  DuffyMagic

参考文章(https://testerhome.com/topics/11385
遇到产品上线后出现的问题,分为4个部分:影响范围评估、快速恢复、定位方法、问题复盘
1、影响范围评估
(1)判断为功能故障、性能故障、硬件故障
(2)如为功能故障判断功能重要性,核心功能、敏感功能(隐私、金钱)、边界功能
(3)影响时间,故障什么时间发现
(4)影响范围,用户范围、功能相关范围、功能有效使用率
2、快速恢复
(1)可以快速定位问题:快速修复验证并发布hotfix版本,由于配置导致的问题修改配置文件,功能关闭
(2)不能快速定位问题:回滚、重启、扩容、降级
3、定位方法
(1)功能问题,日志分析、环境复现
(2)性能问题,查看CPU、内存、网络、磁盘使用情况
(3)环境问题,日志分析、其他相关组件查看
4、问题复盘
(1)问题根本原因分析
(2)问题处理流程,成本大小,是否合理
(3)是否存在其他共性问题
(4)如何避免该问题的发生

上一篇下一篇

猜你喜欢

热点阅读