监控

Prometheus:Up&Running:什么是监控

2018-04-27  本文已影响253人  show16

什么是监控? 

中学的时候我的一个老师告诉我们,如果你问10个经济学家经济学是什么意思,那么你将会得到11个答案。监控到底意味着什么,也是同样缺乏共识的。当与人们谈论我是以什么为生的时候,人们总是会认为我是在关注工厂温度,或者监控员工,找出谁在上班时间访问 Facebook,甚至是检测网络上的入侵者。

普罗米修斯不是为了完成其中的任何一件事情而构建的。它的构建目的是帮助软件开发人员和管理人员操作生产中的计算机系统,例如支撑热门网站的应用程序,工具,数据库和网络。

那么,在这种情况下监控到底是什么?我喜欢将这种对计算机系统的监控操作范围缩小到四件事:

报警

知道事情何时出错通常是你想要监控做的最重要的事情。您想要监控系统可以通知人类去查看异常。

调试

出错之后,你已经通知人类了,他们需要排查以确定根本原因并最终解决问题。

趋势

报警和调试通常发生在几分钟到几小时的时间尺度上。虽然不那么紧急,但看到系统如何被使用并随时间变化的能力也很有用。这可以帮助设计决策和流程例如容量规划。

管道

当你只有一把锤子时,所有东西看起来都像钉子一样。最终所有的监控系统都是数据处理管道。有时候将监控系统用于其他目的,而不是构建定制化的解决方案会更方便。这不是严格的监控,但在实践中很常见,所以我喜欢将其包含在内。

上一篇下一篇

猜你喜欢

热点阅读