Innodb中的事务隔离级别和锁的关系

时间 2019-11-17

标签 innodb 事务隔离级别关系栏目 MySQL 繁體版

原文原文链接

前言:html

咱们都知道事务的几种性质，数据库为了维护这些性质，尤为是一致性和隔离性，通常使用加锁这种方式。同时数据库又是个高并发的应用，同一时间会有大量的并发访问，若是加锁过分，会极大的下降并发处理能力。因此对于加锁的处理，能够说就是数据库对于事务处理的精髓所在。这里经过分析MySQL中InnoDB引擎的加锁机制，来抛砖引玉，让读者更好的理解，在事务处理中数据库到底作了什么。mysql

#一次封锁or两段锁？
由于有大量的并发访问，为了预防死锁，通常应用中推荐使用一次封锁法，就是在方法的开始阶段，已经预先知道会用到哪些数据，而后所有锁住，在方法运行以后，再所有解锁。这种方式能够有效的避免循环死锁，但在数据库中却不适用，由于在事务开始阶段，数据库并不知道会用到哪些数据。
数据库遵循的是两段锁协议，将事务分红两个阶段，加锁阶段和解锁阶段（因此叫两段锁）sql

加锁阶段：在该阶段能够进行加锁操做。在对任何数据进行读操做以前要申请并得到S锁（共享锁，其它事务能够继续加共享锁，但不能加排它锁），在进行写操做以前要申请并得到X锁（排它锁，其它事务不能再得到任何锁）。加锁不成功，则事务进入等待状态，直到加锁成功才继续执行。
解锁阶段：当事务释放了一个封锁之后，事务进入解锁阶段，在该阶段只能进行解锁操做不能再进行加锁操做。

事务	加锁/解锁处理
begin；
insert into test .....	加insert对应的锁
update test set...	加update对应的锁
delete from test ....	加delete对应的锁
commit;	事务提交时，同时释放insert、update、delete对应的锁

这种方式虽然没法避免死锁，可是两段锁协议能够保证事务的并发调度是串行化（串行化很重要，尤为是在数据恢复和备份的时候）的。数据库

#事务中的加锁方式安全

##事务的四种隔离级别
在数据库操做中，为了有效保证并发读取数据的正确性，提出的事务隔离级别。咱们的数据库锁，也是为了构建这些隔离级别存在的。网络

隔离级别	脏读（Dirty Read）	不可重复读（NonRepeatable Read）	幻读（Phantom Read）
未提交读（Read uncommitted）	可能	可能	可能
已提交读（Read committed）	不可能	可能	可能
可重复读（Repeatable read）	不可能	不可能	可能
可串行化（Serializable ）	不可能	不可能	不可能

未提交读(Read Uncommitted)：容许脏读，也就是可能读取到其余会话中未提交事务修改的数据
提交读(Read Committed)：只能读取到已经提交的数据。Oracle等多数数据库默认都是该级别 (不重复读)
可重复读(Repeated Read)：可重复读。在同一个事务内的查询都是事务开始时刻一致的，InnoDB默认级别。在SQL标准中，该隔离级别消除了不可重复读，可是还存在幻象读
串行读(Serializable)：彻底串行化的读，每次读都须要得到表级共享锁，读写相互都会阻塞

Read Uncommitted这种级别，数据库通常都不会用，并且任何操做都不会加锁，这里就不讨论了。session

##MySQL中锁的种类
MySQL中锁的种类不少，有常见的表锁和行锁，也有新加入的Metadata Lock等等,表锁是对一整张表加锁，虽然可分为读锁和写锁，但毕竟是锁住整张表，会致使并发能力降低，通常是作ddl处理时使用。并发

行锁则是锁住数据行，这种加锁方法比较复杂，可是因为只锁住有限的数据，对于其它数据不加限制，因此并发能力强，MySQL通常都是用行锁来处理并发事务。这里主要讨论的也就是行锁。高并发

###Read Committed（读取提交内容）
在RC级别中，数据的读取都是不加锁的，可是数据的写入、修改和删除是须要加锁的。效果以下性能

MySQL> show create table class_teacher \G\
Table: class_teacher
Create Table: CREATE TABLE `class_teacher` (
  `id` int(11) NOT NULL AUTO_INCREMENT,
  `class_name` varchar(100) COLLATE utf8mb4_unicode_ci NOT NULL,
  `teacher_id` int(11) NOT NULL,
  PRIMARY KEY (`id`),
  KEY `idx_teacher_id` (`teacher_id`)
) ENGINE=InnoDB AUTO_INCREMENT=5 DEFAULT CHARSET=utf8mb4 COLLATE=utf8mb4_unicode_ci
1 row in set (0.02 sec)
MySQL> select * from class_teacher;
+----+--------------+------------+
| id | class_name   | teacher_id |
+----+--------------+------------+
|  1 | 初三一班     |          1 |
|  3 | 初二一班     |          2 |
|  4 | 初二二班     |          2 |
+----+--------------+------------+

因为MySQL的InnoDB默认是使用的RR级别，因此咱们先要将该session开启成RC级别，而且设置binlog的模式

SET session transaction isolation level read committed; SET SESSION binlog_format = 'ROW';（或者是MIXED）

事务A	事务B
begin;	begin;
update class_teacher set class_name='初三二班' where teacher_id=1;	update class_teacher set class_name='初三三班' where teacher_id=1;
	ERROR 1205 (HY000): Lock wait timeout exceeded; try restarting transaction
commit;

为了防止并发过程当中的修改冲突，事务A中MySQL给teacher_id=1的数据行加锁，并一直不commit（释放锁），那么事务B也就一直拿不到该行锁，wait直到超时。

这时咱们要注意到，teacher_id是有索引的，若是是没有索引的class_name呢？update class_teacher set teacher_id=3 where class_name = '初三一班';
那么MySQL会给整张表的全部数据行的加行锁。这里听起来有点难以想象，可是当sql运行的过程当中，MySQL并不知道哪些数据行是 class_name = '初三一班'的（没有索引嘛），若是一个条件没法经过索引快速过滤，存储引擎层面就会将全部记录加锁后返回，再由MySQL Server层进行过滤。

但在实际使用过程中，MySQL作了一些改进，在MySQL Server过滤条件，发现不知足后，会调用unlock_row方法，把不知足条件的记录释放锁 (违背了二段锁协议的约束)。这样作，保证了最后只会持有知足条件记录上的锁，可是每条记录的加锁操做仍是不能省略的。可见即便是MySQL，为了效率也是会违反规范的。（参见《高性能MySQL》中文第三版p181）

这种状况一样适用于MySQL的默认隔离级别RR。因此对一个数据量很大的表作批量修改的时候，若是没法使用相应的索引，MySQL Server过滤数据的的时候特别慢，就会出现虽然没有修改某些行的数据，可是它们仍是被锁住了的现象。

###Repeatable Read（可重读）
这是MySQL中InnoDB默认的隔离级别。咱们姑且分“读”和“写”两个模块来说解。

####读
读就是可重读，可重读这个概念是一事务的多个实例在并发读取数据时，会看到一样的数据行，有点抽象，咱们来看一下效果。

RC（不可重读）模式下的展示

事务A

事务B

begin;

select id,class_name,teacher_id from class_teacher where teacher_id=1;

id	class_name	teacher_id
1	初三二班	1
2	初三一班	1

update class_teacher set class_name='初三三班' where id=1;

commit;

select id,class_name,teacher_id from class_teacher where teacher_id=1;

id	class_name	teacher_id
1	初三三班	1
2	初三一班	1

读到了事务B修改的数据，和第一次查询的结果不同，是不可重读的。

commit;

事务B修改id=1的数据提交以后，事务A一样的查询，后一次和前一次的结果不同，这就是不可重读（从新读取产生的结果不同）。这就极可能带来一些问题，那么咱们来看看在RR级别中MySQL的表现：

事务A

事务B

事务C

begin;

select id,class_name,teacher_id from class_teacher where teacher_id=1;

id	class_name	teacher_id
1	初三二班	1
2	初三一班	1

update class_teacher set class_name='初三三班' where id=1;

commit;

insert into class_teacher values (null,'初三三班',1);

commit;

select id,class_name,teacher_id from class_teacher where teacher_id=1;

id	class_name	teacher_id
1	初三二班	1
2	初三一班	1

没有读到事务B修改的数据，和第一次sql读取的同样，是可重复读的。

没有读到事务C新添加的数据。

commit;

咱们注意到，当teacher_id=1时，事务A先作了一次读取，事务B中间修改了id=1的数据，并commit以后，事务A第二次读到的数据和第一次彻底相同。因此说它是可重读的。那么MySQL是怎么作到的呢？这里姑且卖个关子，咱们往下看。

####不可重复读和幻读的区别####
不少人容易搞混不可重复读和幻读，确实这二者有些类似。但不可重复读重点在于update和delete，而幻读的重点在于insert。

若是使用锁机制来实现这两种隔离级别，在可重复读中，该sql第一次读取到数据后，就将这些数据加锁，其它事务没法修改这些数据，就能够实现可重复读了。但这种方法却没法锁住insert的数据，因此当事务A先前读取了数据，或者修改了所有数据，事务B仍是能够insert数据提交，这时事务A就会发现莫名其妙多了一条以前没有的数据，这就是幻读，不能经过行锁来避免。须要Serializable隔离级别，读用读锁，写用写锁，读锁和写锁互斥，这么作能够有效的避免幻读、不可重复读、脏读等问题，但会极大的下降数据库的并发能力。

因此说不可重复读和幻读最大的区别，就在于如何经过锁机制来解决他们产生的问题。

上文说的，是使用悲观锁机制来处理这两种问题，可是MySQL、ORACLE、PostgreSQL等成熟的数据库，出于性能考虑，都是使用了以乐观锁为理论基础的MVCC（多版本并发控制）来避免这两种问题。

####悲观锁和乐观锁####

悲观锁

正如其名，它指的是对数据被外界（包括本系统当前的其余事务，以及来自外部系统的事务处理）修改持保守态度，所以，在整个数据处理过程当中，将数据处于锁定状态。悲观锁的实现，每每依靠数据库提供的锁机制（也只有数据库层提供的锁机制才能真正保证数据访问的排他性，不然，即便在本系统中实现了加锁机制，也没法保证外部系统不会修改数据）。

在悲观锁的状况下，为了保证事务的隔离性，就须要一致性锁定读。读取数据时给加锁，其它事务没法修改这些数据。修改删除数据时也要加锁，其它事务没法读取这些数据。

乐观锁

相对悲观锁而言，乐观锁机制采起了更加宽松的加锁机制。悲观锁大多数状况下依靠数据库的锁机制实现，以保证操做最大程度的独占性。但随之而来的就是数据库性能的大量开销，特别是对长事务而言，这样的开销每每没法承受。

而乐观锁机制在必定程度上解决了这个问题。乐观锁，大可能是基于数据版本（ Version ）记录机制实现。何谓数据版本？即为数据增长一个版本标识，在基于数据库表的版本解决方案中，通常是经过为数据库表增长一个 “version” 字段来实现。读取出数据时，将此版本号一同读出，以后更新时，对此版本号加一。此时，将提交数据的版本数据与数据库表对应记录的当前版本信息进行比对，若是提交的数据版本号大于数据库表当前版本号，则予以更新，不然认为是过时数据。

要说明的是，MVCC的实现没有固定的规范，每一个数据库都会有不一样的实现方式，这里讨论的是InnoDB的MVCC。

####MVCC在MySQL的InnoDB中的实现
在InnoDB中，会在每行数据后添加两个额外的隐藏的值来实现MVCC，这两个值一个记录这行数据什么时候被建立，另一个记录这行数据什么时候过时（或者被删除）。在实际操做中，存储的并非时间，而是事务的版本号，每开启一个新事务，事务的版本号就会递增。在可重读Repeatable reads事务隔离级别下：

SELECT时，读取建立版本号<=当前事务版本号，删除版本号为空或>当前事务版本号。
INSERT时，保存当前事务版本号为行的建立版本号
DELETE时，保存当前事务版本号为行的删除版本号
UPDATE时，插入一条新纪录，保存当前事务版本号为行建立版本号，同时保存当前事务版本号到原来删除的行

经过MVCC，虽然每行记录都须要额外的存储空间，更多的行检查工做以及一些额外的维护工做，但能够减小锁的使用，大多数读操做都不用加锁，读数据操做很简单，性能很好，而且也能保证只会读取到符合标准的行，也只锁住必要行。

咱们无论从数据库方面的教课书中学到，仍是从网络上看到，大都是上文中事务的四种隔离级别这一模块列出的意思，RR级别是可重复读的，但没法解决幻读，而只有在Serializable级别才能解决幻读。因而我就加了一个事务C来展现效果。在事务C中添加了一条teacher_id=1的数据commit，RR级别中应该会有幻读现象，事务A在查询teacher_id=1的数据时会读到事务C新加的数据。可是测试后发现，在MySQL中是不存在这种状况的，在事务C提交后，事务A仍是不会读到这条数据。可见在MySQL的RR级别中，是解决了幻读的读问题的。参见下图

读问题解决了，根据MVCC的定义，并发提交数据时会出现冲突，那么冲突时如何解决呢？咱们再来看看InnoDB中RR级别对于写数据的处理。

####“读”与“读”的区别
可能有读者会疑惑，事务的隔离级别其实都是对于读数据的定义，但到了这里，就被拆成了读和写两个模块来说解。这主要是由于MySQL中的读，和事务隔离级别中的读，是不同的。

咱们且看，在RR级别中，经过MVCC机制，虽然让数据变得可重复读，但咱们读到的数据多是历史数据，是不及时的数据，不是数据库当前的数据！这在一些对于数据的时效特别敏感的业务中，就极可能出问题。

对于这种读取历史数据的方式，咱们叫它快照读 (snapshot read)，而读取数据库当前版本数据的方式，叫当前读 (current read)。很显然，在MVCC中：

快照读：就是select
- select * from table ....;
当前读：特殊的读操做，插入/更新/删除操做，属于当前读，处理的都是当前的数据，须要加锁。
- select * from table where ? lock in share mode;
- select * from table where ? for update;
- insert;
- update ;
- delete;

事务的隔离级别实际上都是定义了当前读的级别，MySQL为了减小锁处理（包括等待其它锁）的时间，提高并发能力，引入了快照读的概念，使得select不用加锁。而update、insert这些“当前读”，就须要另外的模块来解决了。

###写（"当前读"）
事务的隔离级别中虽然只定义了读数据的要求，实际上这也能够说是写数据的要求。上文的“读”，实际是讲的快照读；而这里说的“写”就是当前读了。
为了解决当前读中的幻读问题，MySQL事务使用了Next-Key锁。

####Next-Key锁
Next-Key锁是行锁和GAP（间隙锁）的合并，行锁上文已经介绍了，接下来讲下GAP间隙锁。

行锁能够防止不一样事务版本的数据修改提交时形成数据冲突的状况。但如何避免别的事务插入数据就成了问题。咱们能够看看RR级别和RC级别的对比

RC级别：

事务A

事务B

begin;

select id,class_name,teacher_id from class_teacher where teacher_id=30;

id	class_name	teacher_id
2	初三二班	30

update class_teacher set class_name='初三四班' where teacher_id=30;

insert into class_teacher values (null,'初三二班',30);

commit;

select id,class_name,teacher_id from class_teacher where teacher_id=30;

id	class_name	teacher_id
2	初三四班	30
10	初三二班	30

RR级别：

事务A

事务B

begin;

select id,class_name,teacher_id from class_teacher where teacher_id=30;

id	class_name	teacher_id
2	初三二班	30

update class_teacher set class_name='初三四班' where teacher_id=30;

insert into class_teacher values (null,'初三二班',30);

waiting....

select id,class_name,teacher_id from class_teacher where teacher_id=30;

id	class_name	teacher_id
2	初三四班	30

commit;

事务Acommit后，事务B的insert执行。

经过对比咱们能够发现，在RC级别中，事务A修改了全部teacher_id=30的数据，可是当事务Binsert进新数据后，事务A发现莫名其妙多了一行teacher_id=30的数据，并且没有被以前的update语句所修改，这就是“当前读”的幻读。

RR级别中，事务A在update后加锁，事务B没法插入新数据，这样事务A在update先后读的数据保持一致，避免了幻读。这个锁，就是Gap锁。

MySQL是这么实现的：

在class_teacher这张表中，teacher_id是个索引，那么它就会维护一套B+树的数据关系，为了简化，咱们用链表结构来表达（其实是个树形结构，但原理相同）

如图所示，InnoDB使用的是汇集索引，teacher_id身为二级索引，就要维护一个索引字段和主键id的树状结构（这里用链表形式表现），并保持顺序排列。

Innodb将这段数据分红几个个区间

(negative infinity, 5],
(5,30],
(30,positive infinity)；

update class_teacher set class_name='初三四班' where teacher_id=30;不只用行锁，锁住了相应的数据行；同时也在两边的区间，（5,30]和（30，positive infinity），都加入了gap锁。这样事务B就没法在这个两个区间insert进新数据。

受限于这种实现方式，Innodb不少时候会锁住不须要锁的区间。以下所示：

事务A

事务B

事务C

begin;

select id,class_name,teacher_id from class_teacher;

id	class_name	teacher_id
1	初三一班	5
2	初三二班	30

update class_teacher set class_name='初一一班' where teacher_id=20;

insert into class_teacher values (null,'初三五班',10);

waiting .....

insert into class_teacher values (null,'初三五班',40);

commit;

事务A commit以后，这条语句才插入成功

commit;

update的teacher_id=20是在(5，30]区间，即便没有修改任何数据，Innodb也会在这个区间加gap锁，而其它区间不会影响，事务C正常插入。

若是使用的是没有索引的字段，好比update class_teacher set teacher_id=7 where class_name='初三八班（即便没有匹配到任何数据）',那么会给全表加入gap锁。同时，它不能像上文中行锁同样通过MySQL Server过滤自动解除不知足条件的锁，由于没有索引，则这些字段也就没有排序，也就没有区间。除非该事务提交，不然其它事务没法插入任何数据。

行锁防止别的事务修改或删除，GAP锁防止别的事务新增，行锁和GAP锁结合造成的的Next-Key锁共同解决了RR级别在写数据时的幻读问题。

###Serializable
这个级别很简单，读加共享锁，写加排他锁，读写互斥。使用的悲观锁的理论，实现简单，数据更加安全，可是并发能力很是差。若是你的业务并发的特别少或者没有并发，同时又要求数据及时可靠的话，可使用这种模式。

这里要吐槽一句，不要看到select就说不会加锁了，在Serializable这个级别，仍是会加锁的！

参考资料

MySQL参考手册
《高性能MySQL》第三版

摘自：http://tech.meituan.com/innodb-lock.html