Distributed Systems

mysql mvcc机制

2020-01-01  本文已影响0人  尹楷楷

MVCC并发控制中,读操作可以分成两类:快照读 (snapshot read)与当前读 (current read)。

多版本并发控制(MVCC:multi-version concurrency control )

MVCC定义:多版本并发控制系统。可认为是行级锁的一个变种,它能够避免更多情况下的加锁操作。

作用:避免一些加锁操作,提升并发性能。

快照读是哪些

一个正常的select…语句就是快照读。

快照读,使得在RR(repeatable read)级别下一个普通select...语句也能做到可重复读。即前面MVCC里提到的利用可见版本来保证数据的一致性。

当前读是哪些

insert语句、update语句、delete语句、显示加锁的select语句(select… LOCK IN SHARE MODE、select… FOR UPDATE)是当前读。

为什么insert、update、delete语句都属于当前读?

这是因为这些语句在执行时,都会执行一个读取当前数据最新版本的过程。

当前读的SQL语句,InnoDB是逐条与MySQL Server交互的。即先对一条满足条件的记录加锁后,再返回给MySQL Server,当MySQL Server做完DML操作后,再对下一条数据加锁并处理。

基本特征

MVCC机制在事务隔离级别下

image.png image.png

MVCC只在2级和3级( RC 和 RR)下工作

MVCC导致的结果

image.png

实验证明MVCC:

CREATE TABLE `test`  (
  `id` int(11) NOT NULL,
  `a` varchar(255) CHARACTER SET utf8mb4 COLLATE utf8mb4_unicode_ci NULL DEFAULT NULL,
  `b` varchar(255) CHARACTER SET utf8mb4 COLLATE utf8mb4_unicode_ci NULL DEFAULT NULL,
  `c` varchar(255) CHARACTER SET utf8mb4 COLLATE utf8mb4_unicode_ci NULL DEFAULT NULL,
  PRIMARY KEY (`id`) USING BTREE
) ENGINE = InnoDB CHARACTER SET = utf8mb4 COLLATE = utf8mb4_unicode_ci ROW_FORMAT = Dynamic;

实验一、在RR下, 以为会查到其他事务提交的数据(幻读),但是在A事务中,B事务提交前后两次查询test表都没有查询到B事务插入的id为2的记录。原因是MVCC机制在起作用, 在MVCC下select是快照读,只读快照版本

image.png
image.png

实验二、在RR下,先开启事务A,然后开启事务B先插入一条id为3的记录提交,事务A在B提交后也执行一条id为3的插入操作,发现id重复插入失败,而where id=3执行又返回空集(这也是一种幻影读),因为insert操作是当前读,select是快照读!RR隔离级别下MVCC机制一定程度上解决了幻读(select操作),但是无法完全杜绝幻读。

image.png image.png

实验三、在RC下是否存在MVCC机制?


image.png

我做的实验证明RC下不存在MVCC机制,这是我非常疑惑的地方

MVCC机制的原理

在一篇文章上解答了我上面的疑惑,在这里需要感谢一下文章作者---小孩子4919
https://mp.weixin.qq.com/s?__biz=MzIwNTc4NTEwOQ==&mid=2247487713&idx=1&sn=96f4fa48b9e3f2802e24e8b839f47c5d&chksm=972ac19ba05d488d57e2989da175e272cfc9e85d6eac844342064d04f1f64fef32a259e928c1&mpshare=1&scene=1&srcid=&sharer_sharetime=1578051176803&sharer_shareid=f4084b479306109ea753fc2eac962dee#rd

版本链

对于使用InnoDB存储引擎的表来说,它的聚簇索引记录中都包含两个必要的隐藏列(row_id并不是必要的,我们创建的表中有主键或者非NULL唯一键时都不会包含row_id列):

SELECT TRX_ID FROM INFORMATION_SCHEMA.INNODB_TRX  WHERE TRX_MYSQL_THREAD_ID = CONNECTION_ID();

比方说我们的表t现在只包含一条记录:

mysql> SELECT * FROM t;
+----+--------+
| id | c      |
+----+--------+
|  1 | 刘备   |
+----+--------+
1 row in set (0.01 sec)

假设插入该记录的事务id为80,那么此刻该条记录的示意图如下所示:

image

假设之后两个id分别为100200的事务对这条记录进行UPDATE操作,操作流程如下:

image

每次对记录进行改动,都会记录一条undo日志,每条undo日志也都有一个roll_pointer属性(INSERT操作对应的undo日志没有该属性,因为该记录并没有更早的版本),可以将这些undo日志都连起来,串成一个链表,所以现在的情况就像下图一样:

image

对该记录每次更新后,都会将旧值放到一条undo日志中,就算是该记录的一个旧版本,随着更新次数的增多,所有的版本都会被roll_pointer属性连接成一个链表,我们把这个链表称之为版本链,版本链的头节点就是当前记录最新的值。另外,每个版本中还包含生成该版本时对应的事务id,这个信息很重要,我们稍后就会用到。

ReadView

对于使用READ UNCOMMITTED隔离级别的事务来说,直接读取记录的最新版本就好了,对于使用SERIALIZABLE隔离级别的事务来说,使用加锁的方式来访问记录。
对于使用READ COMMITTED和REPEATABLE READ隔离级别的事务来说,就需要用到我们上边所说的版本链了,核心问题就是:需要判断一下版本链中的哪个版本是当前事务可见的

所以设计InnoDB的大叔提出了一个ReadView的概念,这个ReadView中主要包含当前系统中还有哪些活跃的读写事务,把它们的事务id放到一个列表中,我们把这个列表命名为为m_ids。这样在访问某条记录时,只需要按照下边的步骤判断记录的某个版本是否可见:

可以自己在RC和RR下分别试验

上一篇 下一篇

猜你喜欢

热点阅读