设计数据密集型应用

《设计数据密集型应用》第七章(7) 事务:串行化(2)

2019-05-06  本文已影响0人  MeazZa

本节我们继续讨论关于事务串行化的另一种实现方式:两阶段锁(two-phase locking,2PL),它也是一种强隔离性的保证。

两阶段锁

注意,这里不是两阶段提交(2PC),两阶段提交将在后面介绍。

之前我们介绍避免dirty writes时,提到了当两个事务尝试写相同的数据对象时,锁保证第二个写入者必须第一个的事务完成才能继续。对于两阶段锁来说,除了这个要求以外,还要求以下两点:

在两阶段锁中,写入并不仅阻塞写入,也会阻塞读取;反过来,读取也会阻塞写入,这和Snapshot隔离性的读写不互相阻塞是完成不同的。因此两阶段锁可以完全避免事务的并发性问题。

两阶段锁的实现

读取和写入时,通过对数据对象加不同的锁,也就是共享锁排他锁来实现。锁的行为可以总结如下:

由于使用到了很多锁,可能出现事务A长时间等待事务B释放锁的情况等,称之为死锁。数据库会自动检测死锁的情况,并且在死锁出现时中止其中一个事务,使另外一个事务能够继续执行。

两阶段锁的性能

数据库设计时是没有限制事务的持续时间的,因此事务在对数据加锁之后,可能导致事务的处理时间增加。两阶段锁使得事务处理的时间变得不那么稳定,在大多数情况下延迟都是很低的,但如果出现一个慢的事务,或者一个事务访问很多数据,加了很多锁,会导致系统有可能整体卡住。这种不稳定性在我们需要鲁棒性的系统时是有问题的。

同时,两阶段锁使死锁出现的几率大大增加。在死锁出现时,许多事务会不断的中止和重试,对于性能的影响也是很大的。

谓词锁(Predicate locks)

谓词锁可以用来解决之前我们介绍的幻读(phantoms)问题。基本的原理是在查询时,将查询的条件视为锁。该锁并不匹配数据库中的任何数据,比如以下的查询:

SELECT * FROM bookings
  WHERE room_id = 123 AND
    end_time > '2018-01-01 12:00' AND
    start_time < '2018-01-01 13:00';

谓词锁和两阶段锁有些类似,它的使用方式如下:

该方式可以解决有些数据在查询时不存在,但可能会在未来添加,也就是write skew和幻读的问题。

索引范围锁(Index-range locks)

上面加谓词锁的方式,在实际使用时性能表现并不太好:我们对活动的事务加了太多的锁,在匹配时需要花的时间比较长。因此,我们将谓词锁优化为索引范围锁。

基本思路是,如果我们放大谓词锁的数据范围,只是会对更大范围的数据加锁,但是不会影响隔离性的。因此,我们选择谓词中的索引字段,针对这些索引字段加锁,这样在查询时速度是很快的。

假设在预定会议室的例子中,我们对room_id和/或start_time和end_time加了索引,如果我们想要预定room 123在中午12点到下午1点的会议室时,索引范围锁的工作方式如下:

每种方式都是使用索引的近似查询条件,如果其他事务修改的会议室或者时间与该事务有交叉,则必须要等待该事务先提交并释放锁。

如果没有合适的索引进行加锁,则会降级对整个数据库加共享锁,这会阻止其他所有事务写入数据库,是性能不高但是安全的方式。

上一篇下一篇

猜你喜欢

热点阅读