我们的系统应该配置哪些监控报警项?

2024-11-24  本文已影响0人  老马啸西风2020

随笔

从千万粉丝“何同学”抄袭开源项目说起,为何纯技术死路一条?

数据源的统一与拆分

监控报警系统的指标、规则与执行闭环

我们的系统应该配置哪些监控报警项?

监控报警系统如何实现自监控?

java 老矣,尚能饭否?

一骑红尘妃子笑,无人知是荔枝来!

应用监控指北

解设我们千辛万苦搭建好了一个监控平台,那么应该配置哪些监控项呢?

本文将以通俗易懂的方式,梳理简单梳理一下需要的关键监控项。

一、基础设施层监控

1. 服务器硬件资源

2. 虚拟化和容器

工具推荐:使用普米(Prometheus)和 Zabbix 进行实时监控。

二、应用层监控

1. 服务健康状态

2. 应用性能

3. 日志异常

工具推荐:使用 CAT 监控性能,日志指标采集工具监控日志异常。

三、数据库层监控

1. 连接池

2. 查询性能

3. 数据库资源

数据库监控也可以通过普米设置报警。连接池可以通过 CAT 中的拓展。慢日志可以基于日志。

四、网络层监控

1. API网关

2. 网络连接


五、安全监控

1. 用户行为

2. 系统漏洞

这些一般隶属于安全部门处理,但是安全部门一般不是研发,也是需要借助一个平台的。

六、业务指标监控

1. 核心业务流程

2. 自定义指标

根据业务模型定制监控指标(如库存状态、广告点击率)。

业务系统是非常复杂的,一般可以配置数量+失败率/成功率+波动比例

总结

实施监控的关键原则

  1. 全面性
    覆盖系统的各个层级,避免监控盲区。
  2. 实时性
    快速收集数据,及时发现并处理问题。
  3. 高可用性
    监控系统本身需要稳定可靠。
  4. 灵活性
    支持动态调整监控规则和指标。

结合自己具体的业务,配置后及时的处理报警,而不是等用户报警上来时,希望可以帮到你。

上一篇 下一篇

猜你喜欢

热点阅读