【mongoDB】MongoDB 主从数据同步原理和过程

2023-09-05  本文已影响0人  Bogon

MongoDB中的副本集是一组维护相同数据集合的 mongod进程。
副本集提供了冗余和高可用性,并且这是所有生产部署的基础。

image.png image.png

复制集中的OpLog

oplog(操作日志)是一个特殊的有上限的集合(老的日志会被overwrite),它保存所有修改数据库中存储的数据的操作的滚动记录。

从MongoDB 4.0开始,与其他有限集合不同,oplog集合可以超过其配置的大小限制,以避免大多数提交点被删除。

MongoDB在主节点上应用数据库操作,然后将这些操作记录到主节点的oplog上。然后从节点成员会以异步的方式复制并应用这些操作。

所有副本集成员都包含一个oplog的副本,其位于local.oplog.rs 集合中,该集合可以让副本集成员维护数据库的当前状态。

为了便于复制,所有副本集成员将心跳(ping)发送给所有其他成员。任何从节点成员都可以从任何其他成员导入oplog条目。

oplog中的每个操作都是幂等的,也就是说,对目标数据集应用一次或多次oplog操作都会产生相同的结果。

什么是OpLog?

MongoDB在主节点上应用数据库操作,然后将这些操作记录到oplog中。然后从节点通过异步进程复制和应用(数据同步)这些操作。在local.oplog.rs集合中,所有复制集成员都包含oplog的一个副本用来维护数据库的当前状态。

MongoDB 4.4支持以小时为单位指定最小操作日志保留期,其中MongoDB仅在以下情况下删除操作日志条目:

$ mongo -h xx.xx.xx.xx --port=27017 --username=username --password='XXX' --authenticationDatabase=admin

> rs.printReplicationInfo()   
configured oplog size:   51200MB
log length start to end: 24019311secs (6672.03hrs)
oplog first event time:  Mon Dec 06 2021 15:28:16 GMT+0800 (CST)
oplog last event time:   Sat Sep 10 2022 15:30:07 GMT+0800 (CST)
now:                     Sat Sep 10 2022 15:30:09 GMT+0800 (CST)

> db.getReplicationInfo() 
{
    "logSizeMB" : 51200,
    "usedMB" : 6221.35,
    "timeDiff" : 24019341,
    "timeDiffHours" : 6672.04,
    "tFirst" : "Mon Dec 06 2021 15:28:16 GMT+0800 (CST)",
    "tLast" : "Sat Sep 10 2022 15:30:37 GMT+0800 (CST)",
    "now" : "Sat Sep 10 2022 15:30:38 GMT+0800 (CST)"
}

> db.printSlaveReplicationInfo()
source: 192.168.69.136:27020
    syncedTo: Sat Sep 10 2022 15:33:11 GMT+0800 (CST)
    0 secs (0 hrs) behind the primary </pre>

在设计OpLog时要考虑什么?

看下MongoDB在设计OpLog时考虑了什么?这对我们在使用和配置oplog有很好的帮助。

复制集中的数据同步

复制集中的数据同步是为了维护共享数据集的最新副本,包括复制集的辅助成员同步或复制其他成员的数据。MongoDB使用两种形式的数据同步:

初始同步(Initial Sync)

从节点当出现如下状况时,需要先进行全量同步

这3个场景分别对应

intial sync流程

复制(Replication),增量同步

initial sync结束后,接下来Secondary就会『不断拉取主上新产生的otlog并重放』,这个过程在Secondary同步慢问题分析也介绍过,这里从另一个角度再分析下。

问题来了,为什么一个简单的『拉取oplog并重放』的动作要搞得这么复杂?

性能考虑,拉取oplog是单线程进行,如果把重放也放到拉取的线程里,同步势必会很慢;所以设计上producer thread只干一件事。

为什么不将拉取的oplog直接分发给replWriter thread,而要多一个replBatcher线程来中转?

oplog重放时,要保持顺序性,而且遇到createCollection、dropCollection等DDL命令时,这些命令与其他的增删改查命令是不能并行执行的,而这些控制就是由replBatcher来完成的。

注意事项

参考

MongoDB 副本集Oplog
https://mp.weixin.qq.com/s/cYincwfjGPw2wXTWVSA9kg

关于MongoDB Oplog窗口时间
https://www.jianshu.com/p/e988b5184780

MongoDB 产品说明
https://mp.weixin.qq.com/s/CyUA88AmLF-tfVQVWmhMEg

NoSQL数据库之MongoDB
https://mp.weixin.qq.com/mp/appmsgalbum?action=getalbum&__biz=MzI0MDQ4MTM5NQ==&scene=1&album_id=2893529094972538880&count=3#wechat_redirect

上一篇 下一篇

猜你喜欢

热点阅读