Paxos算法

2021-09-03 本文已影响0人我犟不过你

Paxos是1990年，莱利斯-兰伯特提出的，基于消息传递，且具有高度容错性的一致性算法。是目前公认的解决分布式一致性最有效的算法之一。

一、Paxos来源

1982年，兰伯特与另外两人发表了论文The Byzantine Generals Problem，提出了一种计算机容错理论，即著名的拜占庭问题：

拜占庭帝国有很多支军队，不同军队间必须制定一个统一的行动计划，从而做出进军或者撤退的决定。而且，各个军队间是被地理位置所分隔开的，依靠军队的通讯员进行通讯。然而通讯员中可能存在叛徒，中途可能篡改消息，如何保证通讯过程中消息的一致性呢？

因为我们的分布式系统大部分都是在局域网当中，因此消息被篡改很不常见。我们通常在实际工作中会假设拜占庭问题是不存在的。

1990年，兰伯特提出了一个理论上的一致性解决方案，同时给出了严格的数学证明。同样是类似拜占庭问题，采用故事的形式来描述这一算法：

在古希腊有一个叫Paxos的小岛，岛上采用议会的形式来通过法令。议会中的议员通过信使进行消息的传递。值得注意的是，议员和信使都是兼职的，他们随时会离开会议厅，设置信使传递的消息可能是重复的，或者一去不复返。因此，议会协议要求在此种情况下仍能保证法令的的正确产生，并且不会出现冲突。

Paxos算法的名字就是取自这个小岛。

兰伯特公认的令人晦涩的算法描述，知道1998年才被接受，从此Paxos 算法正是被计算机科学家接受用于解决分布式系统的一致性问题。

2001年，兰伯特发布了Paxos Made Simple，使用通俗易懂的语言重新讲述的这一算法。

二、算法解析

2.1 问题描述

假设有一组可以提成提案的进程集合，那么对于一个一致性算法来说需要保证以下几点：
1）这些被提出的提案，只有一个可以被选定。
2）如果灭有提案被提出，那么就不会有提案被选定。
3）如果一个提案被选定，进程应该可以获取被选定的提案信息。

关于安全性的条件有如下：
1）只有被提出的提案才能被选定。
2）只有一个值被选定。
3）如果进程认为提案被选定了，那么该提案就是真的被选定的那个。

在Paxos的算法中，有三种角色：
1）proposer 提案者
2）acceptor 接受者
3）learner 学习者

2.2 提案的选定

采取多acceptor的方式进行提案的选定。单acceptor存在单点问题。如何认为这个提案被选定了呢？假设有一个acceptor集合，当有多个acceptor都选定了这个提案，当acceptor达到一定的数量，我们就认定提案选定成功。

整体来说是一个类似于两阶段提交的算法执行过程：
阶段一：
1、proposer提出一个编号是M(n)的提案，然后向超过半数的acceptor发送编号为M(n)prepare请求。
2、一个acceptor接收到编号为M(n)的提案，且该编号大于其所响应的所有编号，那么它就会将它所响应过得最大编号的提案作为响应反馈给proposer，同时acceptor承诺不会再通过小于M(n)的提案。

阶段二：
1、如果proposer收到半数以上acceptor返回的编号为M(n)的响应，那么它就会发送一个针对[M(n),V(n)]提案的Accept请求。
2、如果acceptor收到这个针对[M(n),V(n)]提案的Accept请求，只要该acceptor尚未对大于M(n)的prepare请求作出响应，它就可以通过这个提案。

2.3 提案的获取

如何让learner的获取到通过提案呢？可以使用如下的方案：

让所有的acceptor将他们的提案批准情况，统一发送给一个learner，各个learner之间相互通信。通常是主learner通知其他的learner。

如上方案存在主learner的单点问题，所以需要一个learner的集合。

2.4 通过选主proposer保证算法活性

一个分布式算法通常有两个关键特性，安全性（保证一定不会发生）和活性（保证一定会发生）。

如果任何一个proposer都能提交提案，那么基于前面的实现方案，会导致整个算法死循环。

如：a提出m1的提案，发出prepare请求，acceptor接收并响应，此时b提出一个m2，acceptor同样接收并响应。当a在第二阶段发起提案时，发现m1被丢弃了，又会发出一个m3的prepare请求，导致死循环。

此时需要最proposer进行选举，只有主proposer才能和过半的acceptor通讯，只要主proposer提出一个提案，就会被接受。当proposer发现当前有一个更大的提案，则会丢弃小的提案，并最终选出一个更大的提案。

三、总结

Paxos引入了过半的概念，少数服从多数。
Paxos支持节点角色的轮换，避免分布式单点。

是目前最优秀的分布式算法之一。