MYSQL-事务原理

2019-07-08 本文已影响8人小亮__

ACID模型

MYSQL传统关系数据库的ACID模型有以下特性

Atomicity原子性：一个事务中所有操作都必须全部完成，要么全部不完成。
Consistency一致性. 在事务开始或结束时，数据库应该在一致状态。
Isolation隔离性. 事务将假定只有它自己在操作数据库，彼此不知晓。
Durability持久性.一旦事务完成，就不能返回。

而MYSQL上述的ACID模型的实现原理如下

事务的原子性是通过 undo log 来实现的
事务的持久性性是通过 redo log 来实现的
事务的隔离性是通过 (读写锁+MVCC)来实现的
而事务的终极大 boss 一致性是通过原子性，持久性，隔离性来实现的！！！

下面就分别来介绍其实现原理

原子性（Atomicity）原理

一个事务必须被视为不可分割的最小工作单位，一个事务中的所有操作要么全部成功提交，要么全部失败回滚，对于一个事务来说不可能只执行其中的部分操作，这就是事务的原子性。

以上概念大家都了解，那么数据库是怎么实现的呢？就是通过回滚操作。所谓回滚操作就是当发生错误异常或者显式的执行rollback语句时需要把数据还原到原先的模样，所以这时候就需要用到undo log来进行回滚。

undo log 就是用于记录更新或新增操作之前的数据状态，当出现需要回滚的情况时，将原数据刷回到数据库中，从而保证操作的原子性，具体实现方式如下：

上面从银行账户转账到理财账户的操作步骤如下
1.事务开始
2.查询数据
3.进行update操作，balance=balance-400;
4.记录zhangsan（1000）到undo log 日志中，回滚时需要将数据更新回来
5.进行update操作，amount=amount+400；
6.记录amount（0）到undo log日志中，回滚的时候需要将数据刷新回来
7.事务提交/回滚

持久性（Durability）原理

事务一旦提交，其所作做的修改会永久保存到数据库中，此时即使系统崩溃修改的数据也不会丢失。

MySQL的数据存储，表数据是存放在磁盘上的，因此想要存取的时候都要经历磁盘IO,然而即使是使用SSD磁盘IO也是非常消耗性能的。为此，为了提升性能InnoDB提供了缓冲池(Buffer Pool)，Buffer Pool中包含了磁盘数据页的映射，可以当做缓存来使用：

读数据：会首先从缓冲池中读取，如果缓冲池中没有，则从磁盘读取在放入缓冲池；
写数据：会首先写入缓冲池，缓冲池中的数据会定期同步到磁盘中；

上面这种缓冲池的措施虽然在性能方面带来了质的飞跃，但是它也带来了新的问题，当MySQL系统宕机，断电的时候可能会丢数据！因为我们的数据已经提交了，但此时是在缓冲池里头，还没来得及在磁盘持久化，所以我们急需一种机制需要存一下已提交事务的数据，为恢复数据使用。
redo log就派上用场了

redo log来记录已成功提交事务的修改信息，并且会把redo log持久化到磁盘，系统重启之后在读取redo log恢复最新数据。

隔离性（Isolation）原理

Mysql 隔离级别有以下四种（级别由低到高）：

READ UNCOMMITED (读未提交)
READ COMMITED (读已提交)
REPEATABLE READ (可重复读)
SERIALIZABLE (串行化)

隔离性是要管理多个并发读写请求的访问顺序。这种顺序包括串行或者是并行，从隔离性的实现可以看出这是一场数据的可靠性与性能之间的权衡，可靠性性高的，并发性能低(比如 Serializable)，可靠性低的，并发性能高(比如 Read Uncommited)

READ UNCOMMITTED

概念：在READ UNCOMMITTED隔离级别下，事务中的修改即使还没提交，对其他事务是可见的。事务可以读取未提交的数据，造成脏读。

原理：因为读不会加任何锁，所以写操作在读的过程中修改数据，所以会造成脏读。好处是可以提升并发处理性能，能做到读写并行。

READ COMMITTED

概念：一个事务的修改在他提交之前的所有修改，对其他事务都是不可见的。其他事务能读到已提交的修改变化。在很多场景下这种逻辑是可以接受的

原理：InnoDB在 READ COMMITTED，使用排它锁,读取数据不加锁而是使用了MVCC机制。或者换句话说他采用了读写分离机制。

READ COMMITTED 级别下的MVCC机制，在该隔离级别下每次 select的时候新生成一个版本号，所以每次select的时候读的不是一个副本而是不同的副本。在每次select之间有其他事务更新了我们读取的数据并提交了，那就出现了不可重复读

REPEATABLE READ(Mysql默认隔离级别)

在一个事务内的多次读取的结果是一样的。这种级别下可以避免，脏读，不可重复读等查询问题。mysql 有两种机制可以达到这种隔离级别的效果，分别是采用读写锁以及MVCC。

采用读写锁的实现

优点：实现起来简单，缺点：无法做到读写并行

采用MVCC的实现

多次读取只生成一个版本，读到的自然是相同数据
优点：读写并行，缺点：实现的复杂度高

MVCC (MultiVersion Concurrency Control) 叫做多版本并发控制，InnoDB的 MVCC ，是通过在每行记录的后面保存两个隐藏的列来实现的。这两个列，一个保存了行的创建时间，一个保存了行的过期时间，当然存储的并不是实际的时间值，而是系统版本号，其实现思想是通过数据多版本来做到读写分离。从而实现不加锁读进而做到读写并行。MVCC在mysql中的实现依赖的是undo log与read view

undo log :undo log 中记录某行数据的多个版本的数据。
read view :用来判断当前版本数据的可见性

SERIALIZABLE

该隔离级别理解起来最简单，实现也最单。在隔离级别下除了不会造成数据不一致问题，没其他优点。