专栏系列文章：MySQL系列专栏web

MVCC

MVCC 介绍

前面在事务原子性之UndoLog 这篇文章中屡次提到过MVCC这个东西了，咱们说执行DELETE语句或者更新主键的UPDATE语句并不会当即把对应的记录直接从页面中删除，而是将记录头的delete_mask设置为1，作标记删除，这主要就是为MVCC服务的。数据库

而后在事务基础这篇文章中介绍了并发事务会有 脏写、脏读、不可重复读、幻读 四个问题，脏写能够经过乐观锁或悲观锁的方式来解决，脏读、不可重复读、幻读 三个问题须要数据库提供必定的事务隔离机制来解决，也就是事务的隔离性。markdown

SQL标准的事务隔离级别有四个，分别能解决并发事务的一些问题：并发

脏读、不可重复读、幻读 说的都是并发读取的问题，最简单的方式就是给记录加一把锁，不论是更新、读取记录都须要竞争到这把锁以后才能操做。但这种方式的并发性能可想而知会有多么低。post

因而 InnoDB 就设计了MVCC来解决并发读取的问题，MVCC 就是多版本并发控制（Multi-Version Concurrency Control）。在 RC、RR 这两种隔离级别下执行SELECT查询时，经过访问记录的版本链，而不须要加锁，这样使得不一样事务的读-写操做能够并发执行，从而提高数据库的性能。性能

undo log 版本链

前面说 MVCC 是读取记录的版本链实现的，这个版本链其实就是由undo log造成的一个版本链条。url

以事务原子性之UndoLog 文章中的这幅图为例，很直观的能够看到，增删改产生的 undo log 经过old roll_pointer连成一个单向链表，记录中的隐藏列roll_pointer则指向最新的一个undo log，就是undo版本链的头结点。spa

记录中始终都是最新更新的值，可能更新这条记录的事务还未提交：设计

对于使用 RU 隔离级别的事务来讲，因为能够读到未提交事务修改过的记录，因此直接读取记录的最新版本就行了。3d
对于使用 SERIALIZABLE 隔离级别的事务来讲，InnoDB 使用加锁的方式来访问记录。这个后面再说。
对于使用 RC、RR 隔离级别的事务来讲，都必须保证读到已提交事务修改过的记录，若是另外一个事务修改的记录还未提交，是不能直接读取记录的最新版本的，此时就能够沿着undo版本链查找当前事务可见的版本。

ReadView

上一节说到在RC、RR隔离级别下，要保证读到已提交事务修改过的记录，就要在undo版本链上找到当前事务可见的版本。那如何判断版本链上的哪一个版本是当前事务可见的呢？

InnoDB 设计了一个 ReadView，在执行一个事务的时候就会建立一个ReadView。

ReadView 有四个关键属性：

m_ids：在生成 ReadView 时当前系统中活跃的事务的事务ID列表。
min_trx_id：生成 ReadView 时当前系统中活跃的事务中最小的事务ID，也就是m_ids中的最小值。
max_trx_id：生成 ReadView 时系统中分配给下一个事务的ID值，就是全局事务ID（Max Trx Id），注意并非m_ids中的最大值。
creator_trx_id：生成该 ReadView 的事务的事务ID。事务中只有在执行了增删改操做时才会分配一个事务ID，若是是一个只读事务，那 creator_trx_id 默认就为0。

MVCC 原理

undo版本链+ReadView机制

有了ReadView后，在事务中查询的时候，就能够沿着 undo 版本链查找当前事务可见的版本。这时 undo log 中的隐藏列 trx_id 就派上用场了，它表示产生这条 undo log 时的事务的事务ID。判断此版本是否可访问的依据就是用 undo log 中的 trx_id 属性值与 ReadView 中的各个属性作比较。

经过以下步骤来判断版本是否可被访问：

① 若是 trx_id 等于 creator_trx_id ，说明当前事务在访问它本身修改过的记录，因此该版本能够被当前事务访问。
② 若是 trx_id 小于 min_trx_id，说明生成该版本的事务在当前事务生成 ReadView 前已经提交，因此该版本能够被当前事务访问。
③ 若是 trx_id 大于或等于max_trx_id，说明生成该版本的事务在当前事务生成 ReadView 后才开启，因此该版本不能够被当前事务访问。
④ 若是 trx_id 在 min_trx_id 和 max_trx_id 之间，此时再判断一下 trx_id 是否是在 m_ids 列表中，若是在，说明建立 ReadView 时生成该版本的事务仍是活跃的，该版本不能够被访问；若是不在，说明建立 ReadView 时生成该版本的事务已经被提交，该版本能够被访问。

大体的流程图以下：

RC 和 RR 隔离级别

READ COMMITTED 和 REPEATABLE READ 隔离级别的区别就是它们生成ReadView的时机不一样。

READ COMMITTED 是每次查询前都会生成一个独立的 ReadView。
REPEATABLE READ 则只在第一次查询前生成一个 ReadView，以后的查询都重复使用这个 ReadView。
READ UNCOMMITTED 则不须要生成 ReadView，直接读取行记录的数据。

仍是以以前的 account 表为例，下面按照操做发生的时间顺序来进行说明。

一、T1

如今 account 表中的初始状态以下，最后更新这条数据的事务ID为100，card 的值为 AA。

系统下一个要分配的事务ID为150，而后系统有两个事务正在运行，事务ID分别为130、135。

二、T2

此时新开一个事务A，查询ID=1的数据，就会生成一个 ReadView 以下图所示：

此时会先判断记录中的 trx_id(100) 与 creator_trx_id(0) 是否相等，这个条件不知足；

接着判断 trx_id(100) < min_trx_id(130)，这个条件知足，那就直接读取这行数据。

此时在事务A中查询 balance=0 的数据，也只会返回1条数据。

三、T3

接着另外一个事务B（trx_id=150）更新这条数据，将 AA 更新为 BB，事务还未提交。

接着在事务A中再次查询ID=1的这条数据。

在 RC 隔离级别下，会生成一个新的 ReadView：

先判断行记录，发现 trx_id(150) 在 min_trx_id(130) 和 max_trx_id(160) 之间，同时在 m_ids(130,135,150) 列表中，因此记录行上的数据对本事务不可见；而后继续对比以前的版本，发现 AA 这条版本的 trx_id(100) < min_trx_id(130)，因此就返回 AA 这个版本。因此在 RC 隔离级别下屡次读取，看不到别的事务未提交的更新，可避免脏读的问题。

在 RR 隔离级别下，ReadView 不变：

先判断行记录，发现 trx_id(150) 等于 max_trx_id(150)，因此记录行上的数据对本事务不可见；而后继续对比以前的版本，发现 AA 这条版本的 trx_id(100) < min_trx_id(130)，因此就返回 AA 这个版本。因此在 RR 隔离级别下屡次读取，看不到别的事务未提交的更新，可避免脏读的问题。

四、T4

接着事务B提交了更新。

接着在事务A中再次查询ID=1的这条数据。

在 RC 隔离级别下，会生成一个新的 ReadView：

先判断行记录，发现 trx_id(150) 在 min_trx_id(130) 和 max_trx_id(165) 之间，同时不在 m_ids(130,135) 列表中，因此记录行上的数据对本事务可见，返回 BB 这个版本。因此在 RC 隔离级别下屡次读取，是能够看到别的事务已提交的更新，会有不可重复读的问题。

在 RR 隔离级别下，ReadView 不变：

此时的判断跟上一步中的判断是同样的，最后也是返回 AA 个版本。因此在 RR 隔离级别下屡次读取，看不到别的事务已提交的更新，避免了不可重复读的问题。

五、T5

接着一个新的事务（trx_id=175）更新ID=1这条数据，将 BB 更新为 CC，同时还插入了ID=2这条数据，且事务已提交。

这时在事务A中查询 balance=0 的数据。

在 RC 隔离级别下，会生成一个新的 ReadView：

查询ID=1这行记录时，先判断行版本，因为 trx_id(175) 在 min_trx_id(170) 和 max_trx_id(200) 之间，且不在 m_ids(170,180) 列表中，因此返回 CC 这个版本。查询ID=2这行记录时，一样的判断过程，会返回 MM 这个版本。最终查询返回2条数据，而最开始查询只返回1条数据，因此在 RC 隔离级别下屡次读取，会有幻读的问题。

在 RR 隔离级别下，ReadView 不变：

查询ID=1这行记录时，最终会沿着版本链找到 AA 这个版本。查询ID=2这行记录时，trx_id(175) > max_trx_id(150)，因此ID=2这行记录不匹配。最终查询只返回1条数据，因此在 RR 隔离级别下屡次读取，不会有幻读的问题。

六、T6

接着一个新的事务（trx_id=205）删除了ID=1这条数据，但删除的时候并非真正的删除，只是将delete_mask标记为 1。

接着在事务A中再次查询ID=1的这条数据。

因为行记录中 delete_mask 标记为 1 了，是不能被查询的，因此只能沿着版本链查询以前的版本。以后的匹配过程跟前面的描述是相似的，就不在赘述了。在 RC 隔离级别下，会返回 trx_id=175，值为 CC 这个版本。在 RR 隔离级别下，会返回 trx_id=100，值为 AA 这个版本。

MVCC 总结

从上面示例的演示过程就能够看出，MVCC 就是经过 undo log 版本链 + ReadView 实现的一套并发读取的机制。

在 READ COMMITTD 隔离级别下，每次查询都生成一个新的 ReadView，不能读到别的事务未提交的修改，所以解决了 脏读 的问题。可是能读取到别的事务已提交的修改，会有 不可重复读、幻读 的问题。

在 REPEATABLE READ 隔离级别下，只在第一次查询时生成一个 ReadView，以后的查询都重复使用这个 ReadView。别的事务未提交、已提交、新插入的修改都读取不到，所以解决了 脏读、不可重复读、幻读 的问题。

前面介绍 undo log 的文章说过，执行 DELETE 语句或者更新主键的 UPDATE 语句并不会当即把对应的记录彻底从页面中删除，而是将 delete_mask 设置为 1，作标记删除。这时就清楚是为何了，这主要就是为MVCC服务的，由于可能有其它并发运行的事务，要经过版本链读取当前事务可见的版本。

快照读和当前读

有一点须要注意的是，前面的示例中的查询都是简单的SELECT查询，这种就是读取undo版本链上的一个快照版本，能够称为快照读或一致性非锁定读。因为是读取的快照，所以在RR隔离级别下能够避免幻读的发生。

但若是是INSERT、DELETE、UPDATE语句，例以下面的SQL，这个 UPDATE 语句会更新 balance=0 的记录，这种方式就称为当前读，读取的是最新的数据。当前读能读取到别的事务已提交的修改，就可能会产生幻读的问题。

UPDATE account SET balance=100 WHERE balance = 0;
复制代码

例如，在默认RR隔离级别下，按以下顺序执行SQL，Session B 两次普通查询的结果都是同样的，没有幻读的问题。这是由于 Session B 第二次查询读取的是快照版本，即快照读，不会读取到别的事务提交的修改。

Timeline	Session A	Session B	Session C
t1	TUNCATE TABLE account; INSERT INTO account(card) VALUES ('AA');
t2		BEGIN;	BEGIN;
t3		SELECT * FROM account WHERE balance=0; （返回AA这条记录）
t4			INSERT INTO account(card) VALUES ('BB');
t5			COMMIT;
t6		SELECT * FROM account WHERE balance=0; （返回AA这条记录）
u7		COMMIT;

再按照以下顺序执行SQL，Session B 第一次查询 balance=0 的数据只有AA这一条，而后更新 balance=0 的数据，按理来讲只更新一条才对，会发现更新了两条数据，并且再次查询返回了AA、BB这两条数据，此时就产生了幻读的问题。这是由于中间那次更新是当前读，更新时的查询能够读到其它事务提交的更新，此时MVCC是没法解决这个问题的。

Timeline	Session A	Session B	Session C
t1	TUNCATE TABLE account; INSERT INTO account(card) VALUES ('AA');
t2		BEGIN;	BEGIN;
t3		SELECT * FROM account WHERE balance=0; （返回AA这条记录）
t4			INSERT INTO account(card) VALUES('BB')
t5			COMMIT;
t6		UPDATE account SET balance=100 WHERE balance=0; （会看到更新了两行数据）
t7		SELECT * FROM account WHERE balance=100; （返回AA、BB这两条记录）

那当前读这种问题如何解决呢？这就要用到下篇文章中介绍的锁了。

MySQL系列（9）— 事务隔离性之MVCC

MVCC

MVCC 介绍

undo log 版本链

ReadView

MVCC 原理

undo版本链+ReadView机制

RC 和 RR 隔离级别

MVCC 总结

快照读和当前读