SSM+shiro等

分布式事务系统的设计(一)

2017-06-09  本文已影响701人  linking12

1 分布式事务定义

分布式事务就是指事务的参与者、支持事务的服务器、资源服务器以及事务管理器分别位于不同的分布式系统的不同节点之上。以上是百度百科的解释,简单的说,就是一次大的操作由不同的小操作组成,这些小的操作分布在不同的服务器上,且属于不同的应用,分布式事务需要保证这些小操作要么全部成功,要么全部失败。本质上来说,分布式事务就是为了保证不同数据库的数据一致性。

2 分布式事务产生的背景

2.1数据库的分库分表

当数据库单表一年产生的数据超过1000W,那么就要考虑分库分表,具体分库分表的原理在此不做解释,以后有空详细说,简单的说就是原来的一个数据库变成了多个数据库。这时候,如果一个操作既访问01库,又访问02库,而且要保证数据的一致性,那么就要用到分布式事务。

image.png
2.2应用SOA化

所谓的SOA化,就是业务的服务化。比如原来单机支撑了整个电商网站,现在对整个网站进行拆解,分离出了订单中心、用户中心、库存中心。对于订单中心,有专门的数据库存储订单信息,用户中心也有专门的数据库存储用户信息,库存中心也会有专门的数据库存储库存信息。这时候如果要同时对订单和库存进行操作,那么就会涉及到订单数据库和库存数据库,为了保证数据一致性,就需要用到分布式事务。

image.png

3 解决分布式事务所面临的问题

4 典型分布式事务场景

4.1 支付

一笔支付,是对买家账户进行扣款,同时对卖家账户进行加钱,这些操作必须在一个事务里执行,要么全部成功,要么全部失败。而对于买家账户属于买家中心,对应的是买家数据库,而卖家账户属于卖家中心,对应的是卖家数据库,对不同数据库的操作必然需要引入分布式事务。

4.2 下单减库存

在消费者点击购买按钮后,交易后台会进行库存检查、下单、减库存、更新订单状态等一连串的服务调用,每一个操作对应一个独立的服务,服务一般会有独立的数据库,因此产生分布式事务问题。

5 常用解决方案

5.1 基于XA协议的两阶段提交
image.png

优点:

5.2 消息事务+最终一致性
5.2.1 业务与消息耦合

在执行服务A时,同时记录消息数据,这个消息数据和服务A的业务数据保存到同一个数据库实例中。

进程1:
Begin local trx:
服务A DML;
push messageQ “call 服务B”;
Commit/Rollback;

进程2:
for eash message in queue
begin local trx:
服务B DML;
commit/rollback;
if trx.success:
pop message;
end if;
end for;

进程1中,由于消息队列和服务A共用数据库资源,可以把消息和服务在单机事务中执行;进程2中,如果服务B执行失败,重新消费消息重试即可;进程2中,如果服务B执行成功、删除消息失败,如果服务B能够实现幂等然后可以重试(可以改造服务B,执行B的事务中,同步插入一行记录描述B是否执行,重试时检查下即可消除对幂等的要求)。

优点:满足业务最终一致要求的同时,有高性能;
缺点:消息系统和资源管理器需要共用数据库资源,不利于业务分层;系统延迟高,没有隔离性;一旦消息产生,后续业务不允许失败,一旦中间某个阶段出现无法继续的情况,即需要人工介入;系统开发成本高,开发人员需要关注分布式事务对业务的影响以及各种状态转换,测试困难,一般来说,开发成本会是不考虑事务的许多倍。

5.2.2 业务与消息解耦

上述方案中,消息资源和业务共用数据库资源,无法解决调用多于2个服务的业务场景,无法应对业务执行顺序发生变更的需求。因此,考虑将业务资源和消息资源解耦。

进程1:
push half message;
Begin local trx:
服务A DML;
Commit/Rollback;
If trx.success
Commit half message;
End if;

进程2:
for eash message in queue
begin local trx:
服务B DML;
commit/rollback;
if trx.success:
pop message;
end if;
end for;

进程1中,首先发送半消息,该消息还不能被消费,然后执行服务A,服务A执行成功后,使半消息生效,否则删除半消息。进程2的执行逻辑与上面相同。
如果服务A执行成功后、使半消息生效前,进程1crash,消息系统会看到一条半消息,但是不知道服务A是否执行成功,所以要求业务实现回调接口,用于检查服务A是否执行成功。

优点:满足业务最终一致的同时,实现高性能;消息数据独立存储,消除业务系统与消息系统间的耦合;
缺点:一次消息发送需要两次请求;业务处理服务需要实现消息状态回查接口;系统延迟高,没有隔离性;一旦消息产生,后续业务不允许失败,一旦中间某个阶段出现无法继续的情况,即需要人工接入;系统开发成本高,开发人员需要关注分布式事务对业务的影响以及各种状态转换,测试困难,一般来说,开发成本会是不考虑事务的许多倍。

6 分布式事务系统解决方案

6.1整体架构

系统分为三种角色:

分布式事务系统通过两阶段提交方式进行分布式事务推进。
1)客户端向事务协调器注册全局事务作为一阶段的开启的标记;
2)分布式事务内的每一次资源(DB或消息)操作,均通过资源管理器进行,资源管理器向事务协调器注册一个事务分支;
3)客户端通知事务协调器进行全局提交/全局回滚作为一阶段完成的标记

image.png

分布式事务的二阶段由事务协调器驱动,驱动所有事务分支执行提交或回滚操作,一旦确定某个分布式事务提交或回滚,则不断重试所有事务分支,直到完成整个分布式事务提交或回滚

image.png
6.2 系统的结构

需要提供提供多种资源器支持,在接入层,服务化框架自动加入全局事务;在资源管理层,需要提供数据库分库分表组件及支持事务消息的消息系统,如:RabbitMQ、RocketMQ等

image.png
6.3 系统时序图
image.png
6.4 与XA两阶段提交的不同之处
上一篇 下一篇

猜你喜欢

热点阅读