MySQL实战45讲学习笔记:第三十讲

1、复习一下加锁规则

在第20和21篇文章中,我和你介绍了 InnoDB 的间隙锁、next-key lock,以及加锁规则。在这两篇文章的评论区,出现了不少高质量的留言。我以为经过分析这些问题,能够
帮助你加深对加锁规则的理解。bash

因此,我就从中挑选了几个有表明性的问题,构成了今天这篇答疑文章的主题,即:用动态的观点看加锁。session

为了方便你理解,咱们再一块儿复习一下加锁规则。这个规则中,包含了两个“原则”、两个“优化”和一个“bug”:

原则 1:加锁的基本单位是 next-key lock。但愿你还记得,next-key lock 是前开后闭区间。
原则 2:查找过程当中访问到的对象才会加锁。数据结构

优化 1:索引上的等值查询,给惟一索引加锁的时候,next-key lock 退化为行锁。
优化 2:索引上的等值查询,向右遍历时且最后一个值不知足等值条件的时候,next-key lock 退化为间隙锁。并发

一个 bug:惟一索引上的范围查询会访问到不知足条件的第一个值为止。优化

接下来,咱们的讨论仍是基于下面这个表 t:spa

CREATE TABLE `t` (
  `id` int(11) NOT NULL,
  `c` int(11) DEFAULT NULL,
  `d` int(11) DEFAULT NULL,
  PRIMARY KEY (`id`),
  KEY `c` (`c`)
) ENGINE=InnoDB;

insert into t values(0,0,0),(5,5,5),
(10,10,10),(15,15,15),(20,20,20),(25,25,25);

2、不等号条件里的等值查询

有同窗对“等值查询”提出了疑问:等值查询和“遍历”有什么区别?为何咱们文章的例子里面,where 条件是不等号,这个过程里也有等值查询?线程

咱们一块儿来看下这个例子,分析一下这条查询语句的加锁范围:对象

begin;
select * from t where id>9 and id<12 order by id desc for update;

利用上面的加锁规则,咱们知道这个语句的加锁范围是主键索引上的 (0,5]、(5,10] 和 (10,15)。也就是说,id=15 这一行,并无被加上行锁。为何呢?blog

咱们说加锁单位是 next-key lock,都是前开后闭区间,可是这里用到了优化 2,即索引上的等值查询,向右遍历的时候 id=15 不知足条件,因此 next-key lock 退化为了间隙锁(10, 15)。索引

可是,咱们的查询语句中 where 条件是大于号和小于号,这里的“等值查询”又是从哪里来的呢?

要知道,加锁动做是发生在语句执行过程当中的,因此你在分析加锁行为的时候,要从索引上的数据结构开始。这里,我再把这个过程拆解一下。

如图 1 所示,是这个表的索引 id 的示意图。

图 1 索引 id 示意图

1. 首先这个查询语句的语义是 order by id desc,要拿到知足条件的全部行,优化器必须先找到“第一个 id<12 的值”。
2. 这个过程是经过索引树的搜索过程获得的,在引擎内部,实际上是要找到 id=12 的这个值,只是最终没找到,但找到了 (10,15) 这个间隙。
3. 而后向左遍历,在遍历过程当中,就不是等值查询了,会扫描到 id=5 这一行,因此会加一个 next-key lock (0,5]。

也就是说,在执行过程当中,经过树搜索的方式定位记录的时候,用的是“等值查询”的方法。

3、等值查询的过程

与上面这个例子对应的,是 @发条橙子同窗提出的问题:下面这个语句的加锁范围是什么?

begin;
select id from t where c in(5,20,10) lock in share mode;

这条查询语句里用的是 in,咱们先来看这条语句的 explain 结果。

图 2 in 语句的 explain 结果

能够看到,这条 in 语句使用了索引 c 而且 rows=3,说明这三个值都是经过 B+ 树搜索定位的。

在查找 c=5 的时候,先锁住了 (0,5]。可是由于 c 不是惟一索引,为了确认还有没有别的记录 c=5,就要向右遍历,找到 c=10 才确认没有了,这个过程知足优化 2,因此加了间
隙锁 (5,10)。

一样的,执行 c=10 这个逻辑的时候,加锁的范围是 (5,10] 和 (10,15);执行 c=20 这个逻辑的时候,加锁的范围是 (15,20] 和 (20,25)。

经过这个分析,咱们能够知道,这条语句在索引 c 上加的三个记录锁的顺序是:先加 c=5的记录锁,再加 c=10 的记录锁,最后加 c=20 的记录锁。

你可能会说,这个加锁范围,不就是从 (5,25) 中去掉 c=15 的行锁吗?为何这么麻烦地分段说呢?

由于我要跟你强调这个过程:这些锁是“在执行过程当中一个一个加的”,而不是一次性加上去的。

理解了这个加锁过程以后,咱们就能够来分析下面例子中的死锁问题了。

若是同时有另一个语句,是这么写的:

select id from t where c in(5,20,10) order by c desc for update;

此时的加锁范围,又是什么呢?

咱们如今都知道间隙锁是不互锁的,可是这两条语句都会在索引 c 上的 c=五、十、20 这三行记录上加记录锁。

这里你须要注意一下,因为语句里面是 order by c desc, 这三个记录锁的加锁顺序,是先锁 c=20,而后 c=10,最后是 c=5。

也就是说,这两条语句要加锁相同的资源,可是加锁顺序相反。当这两条语句并发执行的时候,就可能出现死锁。

关于死锁的信息,MySQL 只保留了最后一个死锁的现场,但这个现场仍是不完备的。

有同窗在评论区留言到,但愿我能展开一下怎么看死锁。如今,我就来简单分析一下上面这个例子的死锁现场。

4、怎么看死锁?

图 3 是在出现死锁后,执行 show engine innodb status 命令获得的部分输出。这个命令
会输出不少信息,有一节 LATESTDETECTED DEADLOCK,就是记录的最后一次死锁信
息。

图 3 死锁现场

咱们来看看这图中的几个关键信息。

1. 这个结果分红三部分:

一、 TRANSACTION,是第一个事务的信息;

二、 TRANSACTION,是第二个事务的信息;

三、WE ROLL BACK TRANSACTION (1),是最终的处理结果,表示回滚了第一个事务。

2. 第一个事务的信息中:

  • WAITING FOR THIS LOCK TO BE GRANTED,表示的是这个事务在等待的锁信息;
  • index c of table `test`.`t`,说明在等的是表 t 的索引 c 上面的锁;
  • lock mode S waiting 表示这个语句要本身加一个读锁,当前的状态是等待中;
  • Record lock 说明这是一个记录锁;
  • n_fields 2 表示这个记录是两列,也就是字段 c 和主键字段 id;
  • 0: len 4; hex 0000000a; asc ;; 是第一个字段,也就是 c。值是十六进制 a,也就是10;
  • 1: len 4; hex 0000000a; asc ;; 是第二个字段,也就是主键 id,值也是 10;
  • 这两行里面的 asc 表示的是,接下来要打印出值里面的“可打印字符”,但 10 不是可打印字符,所以就显示空格。
  • 第一个事务信息就只显示出了等锁的状态,在等待 (c=10,id=10) 这一行的锁。
  • 固然你是知道的,既然出现死锁了,就表示这个事务也占有别的锁,可是没有显示出来。别着急,咱们从第二个事务的信息中推导出

3. 第二个事务显示的信息要多一些:

  • “ HOLDS THE LOCK(S)”用来显示这个事务持有哪些锁;
  • index c of table `test`.`t` 表示锁是在表 t 的索引 c 上;
  • hex 0000000a 和 hex 00000014 表示这个事务持有 c=10 和 c=20 这两个记录锁;
  • WAITING FOR THIS LOCK TO BE GRANTED,表示在等 (c=5,id=5) 这个记录锁。

从上面这些信息中,咱们就知道:

1. “lock in share mode”的这条语句,持有 c=5 的记录锁,在等 c=10 的锁;
2. “for update”这个语句,持有 c=20 和 c=10 的记录锁,在等 c=5 的记录锁。

所以致使了死锁。这里,咱们能够获得两个结论:

1. 因为锁是一个个加的,要避免死锁,对同一组资源,要按照尽可能相同的顺序访问;
2. 在发生死锁的时刻,for update 这条语句占有的资源更多,回滚成本更大,因此InnoDB 选择了回滚成本更小的 lock in share mode 语句,来回滚。

5、怎么看锁等待?

看完死锁,咱们再来看一个锁等待的例子。

在第 21 篇文章的评论区,@Geek_9ca34e 同窗作了一个有趣验证,我把复现步骤列出来:

图 4 delete 致使间隙变化

能够看到,因为 session A 并无锁住 c=10 这个记录,因此 session B 删除 id=10 这一行是能够的。可是以后,session B 再想 insert id=10 这一行回去就不行了。

如今咱们一块儿看一下此时 show engine innodb status 的结果,看看能不能给咱们一些提示。锁信息是在这个命令输出结果的 TRANSACTIONS 这一节。你能够在文稿中看到这张图片

图 5 锁等待信息

咱们来看几个关键信息。

1. index PRIMARY of table `test`.`t` ,表示这个语句被锁住是由于表 t 主键上的某个锁。

2. lock_mode X locks gap before rec insert intention waiting 这里有几个信息:

  • insert intention 表示当前线程准备插入一个记录,这是一个插入意向锁。为了便于理解,你能够认为它就是这个插入动做自己。
  • gap before rec 表示这是一个间隙锁,而不是记录锁。

3. 那么这个 gap 是在哪一个记录以前的呢?接下来的 0~4 这 5 行的内容就是这个记录的信息。

4. n_fields 5 也表示了,这一个记录有 5 列:

  • insert intention 表示当前线程准备插入一个记录,这是一个插入意向锁。为了便于理解,你能够认为它就是这个插入动做自己。
  • gap before rec 表示这是一个间隙锁,而不是记录锁
  • 0: len 4; hex 0000000f; asc ;; 第一列是主键 id 字段,十六进制 f 就是 id=15。因此,这时咱们就知道了,这个间隙就是 id=15 以前的,由于 id=10 已经不存在了,它表示的就是 (5,15)。
  • 1: len 6; hex 000000000513; asc ;; 第二列是长度为 6 字节的事务 id,表示最后修改这一行的是 trx id 为 1299 的事务。
  • 2: len 7; hex b0000001250134; asc % 4;; 第三列长度为 7 字节的回滚段信息。能够看到,这里的 acs 后面有显示内容 (% 和 4),这是由于恰好这个字节是可打印字 符。后面两列是 c 和 d 的值,都是 15。

所以,咱们就知道了,因为 delete 操做把 id=10 这一行删掉了,原来的两个间隙(5,10)、(10,15)变成了一个 (5,15)。

说到这里,你能够联合起来再思考一下这两个现象之间的关联:

1. session A 执行完 select 语句后,什么都没作,但它加锁的范围忽然“变大”了;
2. 第 21 篇文章的课后思考题,当咱们执行 select * from t where c>=15 and c<=20order by c desc lock in share mode; 向左扫描到 c=10 的时候,要把 (5, 10] 锁起来

也就是说,所谓“间隙”,其实根本就是由“这个间隙右边的那个记录”定义的。

6、update 的例子

看过了 insert 和 delete 的加锁例子,咱们再来看一个 update 语句的案例。在留言区中@信信 同窗作了这个试验:

图 6 update 的例子

你能够本身分析一下,session A 的加锁范围是索引 c 上的 (5,10]、(10,15]、(15,20]、(20,25] 和 (25,supremum]。以后 session B 的第一个 update 语句,要把 c=5 改为 c=1,你能够理解为两步:

1. 插入 (c=1, id=5) 这个记录;
2. 删除 (c=5, id=5) 这个记录。

按照咱们上一节说的,索引 c 上 (5,10) 间隙是由这个间隙右边的记录,也就是 c=10 定义的。因此经过这个操做,session A 的加锁范围变成了图 7 所示的样子:
注意:根据 c>5 查到的第一个记录是 c=10,所以不会加 (0,5] 这个 next-key lock。

图 7 session B 修改后, session A 的加锁范围


好,接下来 session B 要执行 update t set c = 5 where c = 1 这个语句了,同样地能够拆成两步:

1. 插入 (c=5, id=5) 这个记录;
2. 删除 (c=1, id=5) 这个记录。


第一步试图在已经加了间隙锁的 (1,10) 中插入数据,因此就被堵住了。

7、小结

今天这篇文章,我用前面第 20和第 21 篇文章评论区的几个问题,再次跟你复习了加锁规则。而且,我和你重点说明了,分析加锁范围时,必定要配合语句执行逻辑来进行。

在我看来,每一个想认真了解 MySQL 原理的同窗,应该都要可以作到:经过 explain 的结果,就可以脑补出一个 SQL 语句的执行流程。达到这样的程度,才算是对索引组织表、索
引、锁的概念有了比较清晰的认识。你一样也能够用这个方法,来验证本身对这些知识点的掌握程度。

在分析这些加锁规则的过程当中,我也顺便跟你介绍了怎么看 show engine innodb status输出结果中的事务信息和死锁信息,但愿这些内容对你之后分析现场能有所帮助。

老规矩,即使是答疑文章,我也仍是要留一个课后问题给你的。

上面咱们提到一个很重要的点:所谓“间隙”,其实根本就是由“这个间隙右边的那个记录”定义的。

那么,一个空表有间隙吗?这个间隙是由谁定义的?你怎么验证这个结论呢?

你能够把你关于分析和验证方法写在留言区,我会在下一篇文章的末尾和你讨论这个问题。感谢你的收听,也欢迎你把这篇文章分享给更多的朋友一块儿阅读。

8、上期问题时间

我在上一篇文章最后留给的问题,是分享一下你关于业务监控的处理经验。

在这篇文章的评论区,不少同窗都分享了不错的经验。这里,我就选择几个比较典型的留言,和你分享吧:

@老杨同志 回答得很详细。他的主要思路就是关于服务状态和服务质量的监控。其中,服务状态的监控,通常均可以用外部系统来实现;而服务的质量的监控,就要经过接口
的响应时间来统计。

@Ryoma 同窗,提到服务中使用了 healthCheck 来检测,其实跟咱们文中提到的select 1 的模式相似。

@强哥 同窗,按照监控的对象,将监控分红了基础监控、服务监控和业务监控,并分享了每种监控须要关注的对象。

这些都是很好的经验,你也能够根据具体的业务场景借鉴适合本身的方案。

相关文章
相关标签/搜索