《大规模分布式存储系统》笔记

《分布式存储系统》--总结③

2018-05-07  本文已影响0人  CPinging

今天写几个协议方面的内容,并附上部分英文的说明解释,更便于我们去理解此方面相关的知识点。


三、分布式协议

        分布式中涉及到许多协议,而今天我在这里记录其中的两个协议,“两阶段提交协议”与“Paxos协议”。这两个协议涉及到操作系统相关的知识,不过也比较贴近日常人们的生活,所以在逻辑方面不难理解。

1 两阶段提交协议(Two-Phase Commit)

        这个协议通常是用来实现分布式事务的处理。在分布式中,我们有许多的机器,然后在处理某个任务的时候我们会用到其中的部分机器去协调处理某一个问题。这个时候就需要我们考虑——这些个机器是否具备这样的能力(资源)去处理?我应该怎么协调他们才能让他们统一去完成一项工作?

        这里我们就要提到几个基础概念。系统一般包括两类节点——“协调者”与“事务参与这”。这和我们平常生活中的组织者与参与者差不多。而前这一般只有一个,后者有多个。例如:此时有4位同学ABCD,A作为组织者要组织BCD去爬山,而我需要向BCD询问他们是否有时间并且有精力去爬。此时我的A作为组织者要做两件事——①请求阶段,即A向BCD发起表决,并等待参与者回复。②提交阶段。即当所有参与者均回答OK,则进行事务提交,否则就不提交该任务。(有一个人不去那我们就不去了)

        所以说,上述两个过程就成为“两阶段提交协议”。但是这个协议的确存在一些问题。例如:比如我的D比较忙,那么B与C中午就进行了回复,D晚上才回复。那么意味着ABC均要等待D。此时我ABC中的资源是要被锁死的,也就意味着LZ等了那么久,你说不去就不去了???是不是有些尴尬。除此之外,如果我的AGG了,那么我这个任务就更无法下达了。此时我就需要一个备用的A'来接替A的工作。并且协调者需要将事物相关信息记录到操作日志中同步到备用协调者。

        注意,我们的这个协议在下发到有结果直接是要有资源锁的。

        我们来看维基百科原文:Two-phase commit protocol - Wikipedia

协议成功与失败的具体步骤

这里要注意这个 releases all the locks and resources


2 Paxos协议

        Paxos在分布式中享有史上“最晦涩”的算法之一。确实,我在理解这个算法的时候也花费了了一些时间,不过我感觉在理解上还有有些不足之处,所以我将网上的讲的比较好的链接放这里,以便大家自习查看(这个博主写的还是比较生动的,还有栗子给吃)

通过实例来理解paxos算法 - CSDN博客

        而这里,我想简单的对上述两个算法进行大致的综合比较分析。

        简单来说,2PC算法用于保证事务操作的原子性。

引用一些比较好的栗子:

1. 用婚礼过程模拟2PC    

牧师(协调者):新郎,你愿意…?    

未婚男(参与者A):YES, I DO.    

牧师(协调者):新娘,你愿意…?    

未婚女(参与者B):YES, I DO.   

牧师(协调者):新郎,入洞房…?    

未婚男(参与者A):OK    

牧师(协调者):新娘,入洞房…?    

未婚女(参与者B):OK    

 牧师(协调者):婚礼结束             

 镜头切换到第二天早清晨。。。。。。。

2. 2PC的问题2PC需要在每次事务提交时,就保证主机(协调者)和参与者一定处于一致性的状态,如果其中有一个参与者出现了故障或者网络问题,不能及时的回应主机(协调者),那么这次事务就宣告失败或者出现阻塞。也就是说对于2PC而言,事务的“原子性”体现在主机(协调者)和所有的参与者上,主机(协调者)和所有的参与者都要保证各自的事务是一个原子操作,从而保证了整个分布式的事务是一个原子操作。(例:就好像新郎和新娘必须全部同意入洞房才能成功,假设到了入洞房阶段,新郎猝死(参与者故障)或者新娘走错了房间(网络异常),结婚都不可能成功。)

如果参与者(假设在第二阶段)出现了网络问题,协调者可能有两个方案可选:方案一是不断持续的继续对未成功的参与者尝试再次提交,这时候就可能把整个分布式事务阻塞在这里,而整个分布式事务就无法提交了。 方案二是尝试回滚那些提交成功的事务,这样在那些提交成功的参与者(单机)上,就违背了事务的“持久性”。 虽然上述两个方案有都有各自的问题,但只要协调者还“存活”,我们还是可以想办法保证这个事务的原子性。但是,假如这时候协调者出现故障,那么问题就来了,这种状态下新的协调者对其他的参与者的情况不了解,参与者对协调者的情况也不了解,这时候的这个事务的状态就是“未决”状态。

而对于Paxos:

Paxos看上去是一个无主的协议,但实际上在paxos的第一个阶段,就是一个leader抢夺战,每个主机在第一阶段都会有一个提案编号,这个提案编号越大,则优先级越高。编号最高的主机获得了主的地位,一旦有新的更高编号出现,则“主”的地位发生变更,每个主机在“宣示”自己的编号失败后,都会递增自己的提案编号,以争夺“主”的地位,每个“主”的任期就是自己的提案编号(对应raft的term)。

        也就是说我们可以将这两个算法融合起来应用,在选取集群leader时使用Paxos算法,而在leader下发任务的时候使用2PC算法。

上一篇下一篇

猜你喜欢

热点阅读