分布式事务 --两阶段和三阶段提交算法

2022-09-25  本文已影响0人  wayyyy
两阶段提交算法

在分布式系统中实现分布式事务,不仅需要我们确保一个操作在一个节点的原子性,还要确保一个操作在多个节点的上原子性。比如 保证在所有节点的数据写操作,要么全部都执行,要么全部的都不执行。
但是,一台机器在执行本地事务的时候无法知道其他机器中的本地事务的执行结果。最后他也就不知道本次事务到底应该commit还是 roolback。所以,大佬们提出的解决办法就是引入一个"协调者"的组件来统一调度所有分布式节点的执行。这也是两阶段提交算法的基础原理。

两阶段提交算法包含2个角色:

image.png

两个阶段:

两阶段提交算法存在的问题

上面说的都是正常的流程,下面,想一想中间的异场景:

所以,从上面可以看出来:两阶段提交存在上述的同步阻塞的问题,单点故障的问题的问题。
有些分布式系统选择不实现分布式事务。如果选择利用两阶段提交来实现分布式事务,那么我们需要考虑各种异常来预防问题。


三阶段提交算法

前文提到,两阶段提交算法异常场景中:

在第一阶段,协调者向参与者发送准备请求后立即发生故障。
此时,参与者将会被阻塞,因为参与者要协调者恢复正常后才能知道本次事务是要提交还是中止。

在上面场景中,存在协调者单点故障会使所有参与者进入阻塞状态,所以两阶段提交是一种阻塞提交算法。

为了解决这一问题,一个直接的想法就是,在协调者失效后,能有一个节点以某种方式充当协调者,继续执行事务,但是参与者并不知道其他参与者的状态(能够满足提交事务否)。

所以,由此诞生了 三阶段提交算法,既然参与者不知道第一阶段的投票结果,三阶段提交就在两阶段提交之间插入一个预提交阶段。在预提交阶段,协调者将第一阶段投票结果发送给所有的参与者,这样,如果在提交阶段协协调者和收到消息后的参与者发生了故障,则可以从剩下的参与者中选出一个充当协调者,新的协调者可以根据预提交阶段的消息,判断是应该执行提交还是中止事务。

三阶段提交算法流程如下:

三阶段提交算法存在的问题

三阶段提交与二阶段提交最大的不同是:三阶段提交是非阻塞协议,即使协调者发生了故障,参与者仍然会选举出新的协调者来推进事务的执行,增加了系统的可用性,防止了协调者单点故障的问题。

那么三阶段提交算法是否解决了所有的问题呢?
并没有 三阶段提交很容易受到网络分区的影响。如图所示:

预提交阶段发生了网络分区,恰好将收到预提交消息的节点和没有收到预提交消息的节点一分为二,同时协调者发生了故障,在这种情况下,两边会各自选出一个新的协调者,收到预提交消息的一边会继续提交事务,而没有收到提交消息并不会执行事务。在这种情况下,整个系统的数据就会出现不一致。

三阶段提交的另一个缺点是:一次事务至少需要三轮消息往返才能完成,这增加了事务的完成时间,导致了较长的延迟。


参考资料
1、《深入理解分布式系统》

上一篇 下一篇

猜你喜欢

热点阅读