监控系列讲座(八)从上到下思考监控架构

2020-08-09  本文已影响0人  炼狱腾蛇Eric

2. 从上到下思考整个架构

这里包含下面几个问题

2.1. 什么系统需要监控

一般来说,运维工程师常见的,需要被监控的系统有

2.2. 需要什么软件来监控

这一部分其实是最能体现工程师的水平的,没有一款开园软件是适合所有场景的,如果我们不想自己开发,那么可能在整个的系统中会用到非常多的监控。但是,首先我们先要了解为什么使用它。就好像你要求找老板申请budget,老板一定会问你why?如果想要你的方案被采纳,就一定要告诉别人way!这其中我做了下面几个场景的总结。

2.3. 监控软件架构

选好了监控软件,就需要设计架构了。我总结的架构设计原则有

2.4. 比较常用的架构

默认文件1594914906592.jpg file

这个架构是一个比较理想的状态。右侧的这些基本都是或者自带监控平台,由于一些网络原因,或者兼容性原因,他们自身的平台是不可以跨平台,或者说一些软件只适用于某些场景,所以我们没必要使用一种软件监控所有的系统。但是,我们展示的时候还是希望能够统一界面,尽量满足最终用户(比如老板,开发,或者一线oncall人员)的体验,做到所见即所得。另外一个问题,也是目前没有太好的解决方案的问题就是报警平台。目前没有非常合适的开源报警工具,一些比较知名的工具,比如pageduty之类,都是需要额外收费的,所以基本上,报警还都是使用右侧各自工具的报警功能来做的。

2.5. 常见的监控指标

我们后面单独用一个篇幅来说这个问题

2.6. 性能调优

调优其实并没有什么定律,调的意思就是试,大到每个环境,中到每个版本,小到一个参数,都会影响整体的性能。我们需要抓住两个点。

监控系统的调优并不仅仅是指针对于响应速度的调优,还有客户体验的调优,比如,警报没有被及时处理,是否需要不停的报告;或者用户针对某个dashboard需要有钻取的功能,就是说,点击某个业务的监控之后,可以链接到另外一个页面,能够展示业务所关联的服务器的状态。这些都应该算是监控调优的一部分,而这些都是需要我们在熟练掌握了多种软件的使用的前提下才能做到的。
为了方便大家学习,请大家加我的微信,我会把大家加到微信群(微信群的二维码会经常变)和qq群821119334,问题答案云原生技术课堂,有问题可以一起讨论

2020 CKA考试视频 真题讲解 https://www.bilibili.com/video/BV167411K7hp

2020 CKA考试指南 https://www.bilibili.com/video/BV1sa4y1479B/

2020年 5月CKA考试真题 https://mp.weixin.qq.com/s/W9V4cpYeBhodol6AYtbxIA

上一篇 下一篇

猜你喜欢

热点阅读