如何设计一个SAGA分布式事务

2022-06-12  本文已影响0人  zhubaba

Orchestration-based saga

源码地址:https://github.com/ikenchina/octopus

理论

论文

Hector Garcia-Molina和Kenneth Salem在1987年发表Saga论文 《SAGAS》,提出了Saga的概念:一个长事务,Long lived transactions (LLTs)。

A LLT is a saga if it can be written as a sequence of transactions that can be interleaved with other transactions.

Saga既然定位为一个长生命周期的事务,所以需要执行的操作(也叫分支事务或子事务)就可能非常多,可能执行长达小时级或者天级别。

理论

核心思想是将长事务拆分为多个短事务,由Saga事务协调器协调,如果每个子事务都正常结束那saga事务则成功完成提交,如果某个步骤失败或过期导致需要回滚,则根据相反顺序对每个子事务执行一次补偿操作。
每个子事务需要满足数据库的一致性,而Saga事务则是relaxing atomic,失败则通过补偿来回滚子事务,来实现最终的一致性。所以整个saga事务的隔离性比较差,但是子事务是满足数据库隔离性的。

Saga的子事务的执行不需要锁定资源或预留资源,而是通过补偿的方式来进行类似于事务的"回滚"操作,来达到最终一致性。所以相对其他分布式事务来说虽然隔离性差,但是并发更高,也就适合做长生命周期的事务。

举例

举个转账的例子:A和B账户余额都是100元,A转账30元给B。
这个Saga事务有两个子事务,

如果子事务A执行成功,而子事务B执行失败,那么只需要对子事务A进行补偿即可:给A的账号添加30元,最终余额是100元。事务执行期间,A的账户余额是70元,所以隔离性差(相当于读未提交的隔离级别),但是不会阻塞资源,性能相对较好。

使用场景
适用于

优点

缺点


设计

基础概念

Saga事务由三种角色组成

事务状态

Saga事务协调者的实现

Saga Service

Saga Executor

异常情况处理

分布式事务实现的一个难点就是时序问题,主要体现在:

因此会产生一些不可预测的异常。

回滚异常

异常流程如下:

所以,为了避免上面异常情况,对于commit和rollback操作,需要进行如下检查

RM在执行commit和rollback操作,事务的状态更改需要保证原子性和隔离性,最好依赖数据库的事务来实现。


开发示例

以公司给员工发薪水作为示例,演示如何通过SDK来实现一个saga事务。
此演示使用了SDK的高级API,屏蔽了各种异常情况的处理,提高了开发的效率。

开发示例

client SDK

client sdk实现了AP和RM的sdk封装,方便进行saga开发。

client SDK

API 设计

API设计

上一篇下一篇

猜你喜欢

热点阅读