MongoDB监控

2020-04-29  本文已影响0人  let懒

监控工具

监控信息来源

db.serverStatus()主要信息

监控报警的考量

主要监控指标及其方式

指标 意义 获取
opcounters(操作计数器) 查询、更新、插入、删除、getmore和其他命令的数量。 db.serverStatus().opcounters
tickets(令牌) 对wiredTiger存储引擎的读/写令牌数量。令牌数量表示了可以进入存储引擎的并发操作数量。 db.serverStatus().wiredTiger.concurrentTransactions
replication lag(复制延迟) 这个指标代表了写操作到达从节点所需要的最小时间。过高的replication lag会减小从节点的价值并且不利于配置了写关注w>1的那些操作 db.adminCommand({'replSetGetStatus': 1 })
oplog window(复制时间窗) 这个指标代表oplog可以容纳多长时间的写操作。它表示了一个从节点可以离线多长时间仍能够追上主节点。通常建议该值应大于24小时为佳。 db.oplog.rs.find().sort({$natural: -1 }).limit( 1 ).next().ts - db.oplog.rs.find().sort({$natural: 1 }).limit( 1 ).next().ts
connections(连接数) 连接数应作为监控指标的一部分,因为每个连接都将消耗资源。应该计算低峰/正常/高峰时间的连接数,并制定合理的报警阈值范围。 db.serverStatus().connections
Query targeting(查询专注度) 索引键/文档扫描数量比返回的文档数量,按秒平均。如果该值比较高表示查询系需要进行很多低效的扫描来满足查询。这个情况通常代表了索引不当或缺少索引来支持查询。 var status = db.serverStatus() status.metrics.queryExecutor.scanned / status.metrics.document.returned status.metrics.queryExecutor.scannedObjects / status.metrics.document.returned
Scan and Order扫描和排序 每秒内内存排序操作所占的平均比例。内存排序可能会十分昂贵,因为它们通常要求缓冲大量数据。如果有适当索引的情况下,内存排序是可以避免的。 var status = db.serverStatus() status.metrics.operation.scanAndOrder / status.opcounters.query
节点状态 每个节点的运行状态。如果节点状态不是PRIMARY、SECONDARY、ARBITER中的一个,或无法执行上述命令则报警 db.runCommand("isMaster")
dataSize(数据大小) 整个实例数据总量(压缩前) 每个DB执行db.stats();
StorageSize(磁盘空间大小) 已使用的磁盘空间占总空间的百分比。
上一篇 下一篇

猜你喜欢

热点阅读