使用Prometheus做监控

2022-06-12  本文已影响0人  深圳都这么冷

Prometheus下一代标准监控的基础设施
想法源自谷歌,产品毕业于CNCF,根正苗红


Prometheus架构图

Prometheus数据类型

Prometheus数据采集方式

Prometheus使用主动拉取的方式,管理节点叫做Server,工作节点叫做exporter,工作节点负责收集该节点的信息,管理节点定时取工作节点同步。
对于临时的推送,Prometheus提供了一个叫做PushGateway的工作节点,用户可以把数据推到这里,然后管理节点再从这里拉取。没有违背pull模式。

Prometheus 接口

用户可以使用PromQL语法直接查询操作Prometheus数据,有很多第三方的图形化工具也可以使用PromQL读取数据生动呈现,比如Grafana

告警

有一个专门负责告警的组件叫做altermanager。管理员可以设置告警规则,满足告警规则的条件,告警内容会被推送到altermanager,然后由altermanager统一处理。
告警有三种状态:
Inactive,非活跃,没有触发
Pending,满足条件,但是还在等待修复中,如果在for等待的时间内修复,不会触发,如果没有for等待的时间,默认直接触发。
Firing,触发,此时才会发送内容到altermanager

有时候修复中需要临时关闭告警规则,可以在altermanager设置silence,让告警保持静默状态。
告警的对象修复后,pending的告警状态会得到修复。
告警发到哪里可以在altermanager定制,比如邮件还是webhook

关于Prometheus的书籍

Prometheus监控实战

这本220页的书定价79,周末一天就可以看完。一本很薄的书不但可以节约你的空间,还能节约你的时间,估计这就是本书虽然薄但是贵的原因吧。内容还是可以的,非常适合入门,看完本书对监控和使用Prometheus监控的全貌有一个完整的视角,推荐!!!

上一篇 下一篇

猜你喜欢

热点阅读