Raft协议原理,论文读后感

2020-10-26  本文已影响0人  喝不醉的Solace

Raft相对Paxos来说,简单很多,且易于实施。另外在选举新Leader方面,Raft优势较Paxos更加快,笔者在使用ZK过程中,Leader挂掉,需要特别多轮才能选举出新的Leader

角色

基础概念

Terms

在分布式系统中,比较棘手的问题就是时间问题,使用物理时间需要确保每台机器时区完全同步,Terms是Raft为了解决分布式系统中时间同步诞生的,可以将其理解为逻辑时间,它可以帮助server检测过期信息比如过期的leader。Raft将时间划分为任意长度的term,用连续整数编号。在收到其他Server发来的请求时,如果发现其他Terms较大,则会更新当前机器Term编号。


Leader选举

Raft使用心跳机制来触发leader选举。当server启动的时候是处于follower状态,当它可以收到来自leader或者candidate的有效RPC请求时就会保持follower的状态。Leader发送周期性的心跳(不含日志的AppendEntries RPC)给所有的follower来确保自己的权威。如果一个follower一段时间(称为election timeout)没有收到消息,它就会假定leader失效并开始新的选举。

为了开始新一轮选举,follower会提高自己当前的term并转为candidate状态。它会先给自己投一票然后并行向集群中的其他server发出RequestVote RPC,candidate会保持这个状态,直到下面三种事情之一发生:


为了解决再次被瓜分的问题

Raft使用随机选举超时来确保选票被瓜分的情况很少出现而且出现了也可以被很快解决。election timeout的值会在一个固定区间内随机的选取(比如150-300ms)。这使得在大部分情况下仅有一个server会超时,它将会在其他节点超时前赢得选举并发送心跳。candidate在发起选

日志备份

以下几个点值得重点关注

日志压缩

随着日志大小的增长,会占用更多的内存空间,处理起来也会耗费更多的时间,对系统的可用性造成影响,因此必须想办法压缩日志大小。Snapshotting是最简单的压缩方法,系统的全部状态会写入一个snapshot保存起来,然后丢弃截止到snapshot时间点之前的所有日志

上一篇 下一篇

猜你喜欢

热点阅读