grafana + prometheus告警配置
2023-04-16 本文已影响0人
伊丽莎白菜
grafana
支持界面化操作告警规则及路由,告警支持推送到email、webhook(钉钉、飞书或自定义的web端点)等连接点,简单易用且功能强大。
prometheus
+grafana
安装配置看这里。
1682041922892.png
添加钉钉机器人
配置钉钉群聊机器人,获取webhook地址,参考钉钉开发者文档;
![](https://img.haomeiwen.com/i24795540/67da2eda1d6f92ff.png)
配置连接点
选择Alerting -> Contract Points,添加钉钉webhook连接点。
![](https://img.haomeiwen.com/i24795540/9c909a4d8bb71b84.png)
测试消息如图:
![](https://img.haomeiwen.com/i24795540/b3c84c0701808150.png)
通知策略配置
- 根策略连接点配置为钉钉
![](https://img.haomeiwen.com/i24795540/06a36a2ed98389c5.png)
- 添加静默策略(例如特定日期不告警)
![](https://img.haomeiwen.com/i24795540/f542fefc8511bbf6.png)
- 配置标签用于策略路由(可选,不配置直接路由到根策略)
![](https://img.haomeiwen.com/i24795540/d517cc1f0bee47f5.png)
告警配置示例
以Node Exporter中的Memory Basic面板为例,配置一个告警规则,当内存占用大于80%时触发告警。
- 编辑面板,选择Alert -> Create alert rule from this panel.
- 为规则命名,例如: Memory Basic
- 设置查询和告警条件
![](https://img.haomeiwen.com/i24795540/c51a086dc8cbbf4b.png)
- 添加一些额外信息,提升告警消息可读性
![](https://img.haomeiwen.com/i24795540/bc8addc91578ad71.png)
- 选择路由标签
![](https://img.haomeiwen.com/i24795540/d96b2db9b9ab5de8.png)
- 保存并退出。
限制条件
截止2023/4/21,grafana最新版9.4.7 Alerting功能还不支持动态参数查询,也就是说查询参数都是写死的。
比如要查询192.168.0.1~192.168.0.3的监控指标,就只能建立3条告警配置项。
好在告警规则有copy选项,copy之后改改ip就能用了。期待grafana后续版本能解决这个问题。