服务端问题排查与系统优化方法

2020-11-13  本文已影响0人  Real_man

在面试时,必不可少的一项就是考察候选人的问题解决能力,如何排查XX问题?如何优化XX系统性能。会使用工具并不能体现不出大家的差别,出现问题时,谁能最快的定位问题与解决问题才能体现出技术水平,而只会问题排查还不够,再勤劳的救火队友也是没有实际业务上的产出,如何通过系统化的手段优化系统,让系统不再出现问题,那升职加薪指日可待。

面试时,我一般会问:你在做项目的过程中有遇到过什么问题吗?一般是怎么解决的?

如果回答是,我遇到了差不多XX问题,还有XX问题,那这种问题一般太偏向于一个点,而不够系统,相比对工作问题也没有很好的总结。

我认为比较好的方式可以参考下面的文章回答,工作中大致遇到过那种类型的问题,一般的解决套路是什么,有哪些常见的问题解决工具。如果进一步谈到避免问题出现,进行系统上优化,取得了什么成效... 那基本上这个候选人就通过了.

假如满分100分的话:

问题排查

日常工作中,可以尝试积累自己的一项问题清单列表,出现问题时依次检查此刻的问题能对应到清单中的那个问题上:

需要自己平时做一些积累,遇到的错误进行记录与复盘,总结与梳理,到形成自己的一套问题列表,并且能进行针对性的解决。

排查过程

排查工具

日志:阿里云SLS,ELK,内部分布式日志系统

监控:

问题定位:

系统优化

快,稳,准:系统响应要快,系统运行要稳定,业务数据要准确

一些指标:

性能优化与做功能需求一样,都是为业务服务的。优化之前想清楚,是否真的需要这次优化,性能优化都不是免费的午餐,优化做的越多,往往可维护性也会越差

性能优化套路:从底层到每一行代码。层次划分明确,从不同的角度优化

稳定性优化:

可维护性优化:《码出高效-阿里巴巴代码规范》

最后

如果能总结出一套自己的问题解决方法论,那就可以很快形成与别人拉开差距的核心竞争力,我也需要再对这方面多做一些思考与梳理。

上一篇下一篇

猜你喜欢

热点阅读