MYSQL-事务原理
ACID模型
MYSQL传统关系数据库的ACID模型有以下特性
- Atomicity原子性:一个事务中所有操作都必须全部完成,要么全部不完成。
- Consistency一致性. 在事务开始或结束时,数据库应该在一致状态。
- Isolation隔离性. 事务将假定只有它自己在操作数据库,彼此不知晓。
- Durability持久性.一旦事务完成,就不能返回。
而MYSQL上述的ACID模型的实现原理如下
事务的原子性是通过 undo log 来实现的
事务的持久性性是通过 redo log 来实现的
事务的隔离性是通过 (读写锁+MVCC)来实现的
而事务的终极大 boss 一致性是通过原子性,持久性,隔离性来实现的!!!
下面就分别来介绍其实现原理
原子性(Atomicity)原理
一个事务必须被视为不可分割的最小工作单位,一个事务中的所有操作要么全部成功提交,要么全部失败回滚,对于一个事务来说不可能只执行其中的部分操作,这就是事务的原子性。
以上概念大家都了解,那么数据库是怎么实现的呢? 就是通过回滚操作。 所谓回滚操作就是当发生错误异常或者显式的执行rollback语句时需要把数据还原到原先的模样,所以这时候就需要用到undo log来进行回滚。
undo log 就是用于记录更新或新增操作之前的数据状态,当出现需要回滚的情况时,将原数据刷回到数据库中,从而保证操作的原子性,具体实现方式如下:
上面从银行账户转账到理财账户的操作步骤如下
1.事务开始
2.查询数据
3.进行update操作,balance=balance-400;
4.记录zhangsan(1000)到undo log 日志中,回滚时需要将数据更新回来
5.进行update操作,amount=amount+400;
6.记录amount(0)到undo log日志中,回滚的时候需要将数据刷新回来
7.事务提交/回滚
持久性(Durability)原理
事务一旦提交,其所作做的修改会永久保存到数据库中,此时即使系统崩溃修改的数据也不会丢失。
MySQL的数据存储,表数据是存放在磁盘上的,因此想要存取的时候都要经历磁盘IO,然而即使是使用SSD磁盘IO也是非常消耗性能的。 为此,为了提升性能InnoDB提供了缓冲池(Buffer Pool),Buffer Pool中包含了磁盘数据页的映射,可以当做缓存来使用:
- 读数据:会首先从缓冲池中读取,如果缓冲池中没有,则从磁盘读取在放入缓冲池;
- 写数据:会首先写入缓冲池,缓冲池中的数据会定期同步到磁盘中;
上面这种缓冲池的措施虽然在性能方面带来了质的飞跃,但是它也带来了新的问题,当MySQL系统宕机,断电的时候可能会丢数据!因为我们的数据已经提交了,但此时是在缓冲池里头,还没来得及在磁盘持久化,所以我们急需一种机制需要存一下已提交事务的数据,为恢复数据使用。
redo log就派上用场了
redo log来记录已成功提交事务的修改信息,并且会把redo log持久化到磁盘,系统重启之后在读取redo log恢复最新数据。
隔离性(Isolation)原理
Mysql 隔离级别有以下四种(级别由低到高):
- READ UNCOMMITED (读未提交)
- READ COMMITED (读已提交)
- REPEATABLE READ (可重复读)
- SERIALIZABLE (串行化)
隔离性是要管理多个并发读写请求的访问顺序。 这种顺序包括串行或者是并行,从隔离性的实现可以看出这是一场数据的可靠性与性能之间的权衡,可靠性性高的,并发性能低(比如 Serializable),可靠性低的,并发性能高(比如 Read Uncommited)
READ UNCOMMITTED
概念:在READ UNCOMMITTED隔离级别下,事务中的修改即使还没提交,对其他事务是可见的。事务可以读取未提交的数据,造成脏读。
原理:因为读不会加任何锁,所以写操作在读的过程中修改数据,所以会造成脏读。好处是可以提升并发处理性能,能做到读写并行。
READ COMMITTED
概念:一个事务的修改在他提交之前的所有修改,对其他事务都是不可见的。其他事务能读到已提交的修改变化。在很多场景下这种逻辑是可以接受的
原理:InnoDB在 READ COMMITTED,使用排它锁,读取数据不加锁而是使用了MVCC机制。或者换句话说他采用了读写分离机制。
READ COMMITTED 级别下的MVCC机制,在该隔离级别下每次 select的时候新生成一个版本号,所以每次select的时候读的不是一个副本而是不同的副本。在每次select之间有其他事务更新了我们读取的数据并提交了,那就出现了不可重复读
REPEATABLE READ(Mysql默认隔离级别)
在一个事务内的多次读取的结果是一样的。这种级别下可以避免,脏读,不可重复读等查询问题。mysql 有两种机制可以达到这种隔离级别的效果,分别是采用读写锁以及MVCC。
-
采用读写锁的实现
优点:实现起来简单,缺点:无法做到读写并行
-
采用MVCC的实现
多次读取只生成一个版本,读到的自然是相同数据
优点:读写并行 ,缺点:实现的复杂度高
MVCC (MultiVersion Concurrency Control) 叫做多版本并发控制,InnoDB的 MVCC ,是通过在每行记录的后面保存两个隐藏的列来实现的。这两个列, 一个保存了行的创建时间,一个保存了行的过期时间, 当然存储的并不是实际的时间值,而是系统版本号,其实现思想是通过数据多版本来做到读写分离。从而实现不加锁读进而做到读写并行。MVCC在mysql中的实现依赖的是undo log与read view
- undo log :undo log 中记录某行数据的多个版本的数据。
- read view :用来判断当前版本数据的可见性
SERIALIZABLE
该隔离级别理解起来最简单,实现也最单。在隔离级别下除了不会造成数据不一致问题,没其他优点。