mvcc详解

2021-06-15  本文已影响0人  愤怒的老照

1 为什么需要MVCC

2 undolog

2.1 undolog定义

在InnoDB中的每一条记录实际都会存在三个隐藏列:

image.png

版本V1、V2并不是物理上真实存在的,而是每次需要的时候根据当前版本和undo log计算出来的。比如,需要V1的时候,就是通过V3依次执行U2、U1算出来。

可以将这些 undo 日志都连起来,串成一个链表,形成版本链。版本链的头节点就是当前记录最新的值。

2.2 undo log分类

2.3 数据删除

删除操作实际上不会直接删除,而只是标记为删除,最终的删除操作是purge线程完成的

purge线程作用

1、清理undo log

2、清除page里面带有Delete_Bit标识的数据行。在InnoDB中,事务中的Delete操作实际上并不是真正的删除掉数据行,而是一种Delete Mark操作,在记录上标识删除,真正的删除工作需要后台purge线程去完成。

2.4 更新主键

聚簇索引和二级索引都无法进行in place update,都会产生两个版本

update分两步执行,先删除该行,再插入一行目标行

image.png

2.5 更新非主键

聚簇索引可以in place update,二级索引产生两个版本

聚簇索引记录undo log,二级索引不记录undo log

更新二级索引,同时需要判断是否修改索引页面的MAX_TRX_ID


image.png

2.6 删除操作

删除操作实际上不会直接删除,而只是标记为删除,最终的删除操作是purge线程完成的

image.png

3 Read View

Read View是InnoDB在实现MVCC时用到的一致性读视图,用于支持读提交和可重复读隔离级别的实现,作用是执行期间判断版本链中的哪个版本是当前事务可见的。

本质上是InnoDB为每个事务构造了一个数组,用来保存当前正在活跃(启动了但还没提交)的所有事务ID。

数组里面事务ID的最小值记为低水位,当前系统里面已经创建过的事务ID的最大值加1记为高水位;这个视图数组和高水位,就组成了当前事务的一致性视图(read-view)。

对于以上事务:

  1. 如果在「已提交事务」部分,表示这个版本是已提交的事务或者是当前事务自己生成的,这个数据对当前事务是可见的;

  2. 如果落在「未开启事务」部分,表示这个版本是由将来启动的事务生成的,是肯定不可见的;

  3. 如果落在「未提交」部分,那就包括两种情况
    a. 若当前版本的trx_id在一致性试图中,表示这个版本是由还没提交的事务生成的,不可见;
    b. 若当前版本的trx_id不在一致性试图中,表示这个版本是已经提交了的事务生成的,可见。

3 MVCC的工作原理

3.1 MVCC查询的工作流程

3.1.1 查询主键索引

生成Read View读视图

通过主键查找记录,根据记录里的DB_TRX_ID与Read View读视图进行可见性判断

配合DB_ROLL_PTR回滚指针和undo log来找到当前事务可见的数据记录

3.1.2 查询二级索引

由于二级索引由于没有三个隐藏列(DB_TRX_ID,DB_ROLL_PTR,DB_ROW_ID)如何实现一致读,可重复读?

更新二级索引列时,旧的二级索引记录将被删除标记(并非真正的删除),新记录将被插入;

如果二级索引记录被标记为删除,或者二级索引页被更新的事务更新,则不使用覆盖索引技术(要通过聚族索引查找正确版本)。

如果启用了索引条件下推(ICP)优化,首先会通过索引下推过滤掉不符合要求的行,来避免使用聚集索引查找。如果找到匹配的记录,即使在删除标记的记录中,InnoDB也会在聚集索引中查找该记录。

具体查询步骤:

3.2 MVCC与隔离级别

MVCC 只在 **Read Commited(读已提交) 和 Repeatable Read(可重读读) **两种隔离级别下工作。

3.3 mvcc能否解决幻读

幻读:在一次事务里面,多次查询之后,结果集的个数不一致的情况叫做幻读。而多出来或者少的哪一行被叫做幻行。

上一篇 下一篇

猜你喜欢

热点阅读