index_merge引起的死锁排查

时间 2019-11-06

标签 index merge 引起死锁排查栏目 Git 繁體版

原文原文链接

概述

前几天排查了一个死锁问题，最开始百思不得其解，由于发生死锁的两个事务是单语句事务，语句类型相同(where属性列相同，仅值不一样)，并且语句都走了相同的索引，但最终确实发生了死锁。经过定位排查发现，问题的源头就是index_merge，死锁的缘由也很普通，两个事务加锁顺序不一样，并存在相互等待的状况。由于这个案例比较特殊，因此在此分享给你们。算法

死锁信息

拿到死锁问题，首先须要查看几个基本信息，包括死锁等待关系，表结构定义等。sql

1.表结构定义

Create Table: CREATE TABLE `t_xxx_customer` (
  `id` bigint(20) unsigned NOT NULL AUTO_INCREMENT COMMENT '主键',
  `partner_id` bigint(20) unsigned DEFAULT NULL,
  `customer_id` bigint(20) unsigned DEFAULT NULL,
  `deleted` tinyint(4) DEFAULT NULL,
  `partner_user_id` bigint(20) unsigned DEFAULT NULL,
  `xxx_id` varchar(128) DEFAULT NULL,
  `xxx_name` varchar(256) DEFAULT NULL,
  PRIMARY KEY (`id`),
  KEY `partner_id` (`partner_id`),
  KEY `customer_id` (`customer_id`),
  KEY `partner_user_id` (`partner_user_id`)
) ENGINE=InnoDB AUTO_INCREMENT=140249 DEFAULT CHARSET=utf8;

2.死锁信息提取与分析

经过show engine innodb status;命令能够获取innodb引擎中最近一次发生死锁的信息，信息以下并发

*** (1) TRANSACTION: UPDATE t_xxx_customer SET xxx_id='101', xxx_name='bbb' where customer_id=235646 and partner_id=1688 and deleted=0;

*** (1) HOLDS THE LOCK(S): RECORD LOCKS space id 1640 page no 3947 n bits 432 index partner_id of table xxx.t_xxx_customer trx id 2625291980 lock_mode X locks rec but not gap Record lock, heap no 334 PHYSICAL RECORD: n_fields 2; compact format; info bits 0 0: len 8; hex 0000000000000698; asc ;; 1: len 8; hex 0000000000021747; asc G;;

*** (1) WAITING FOR THIS LOCK TO BE GRANTED: RECORD LOCKS space id 1640 page no 3395 n bits 160 index  PRIMARY of table t_xxx_customer trx id 2625291980 lock_mode X locks rec but not gap waiting Record lock, heap no 89 PHYSICAL RECORD: n_fields 25; compact format; info bits 0

*** (2) TRANSACTION: UPDATE t_xxx_customer SET xxx_id='102', xxx_name='aaa' where customer_id=151069 and partner_id=1688 and deleted=0;

*** (2) HOLDS THE LOCK(S): RECORD LOCKS space id 1640 page no 3395 n bits 160 index PRIMARY of table xxx.t_xxx_customer trx id 2625291981 lock_mode X locks rec but not gap

*** (2) WAITING FOR THIS LOCK TO BE GRANTED: RECORD LOCKS space id 1640 page no 3947 n bits 432 index partner_id of table xxx.t_xxx_customer trx id 2625291981 lock_mode X locks rec but not gap waiting Record lock, heap no 334 PHYSICAL RECORD: n_fields 2; compact format; info bits 0 0: len 8; hex 0000000000000698; asc ;; 1: len 8; hex 0000000000021747; asc G;;

*** WE ROLL BACK TRANSACTION (2)

从死锁结果来看，咱们很容易看到事务1持有 partner_id二级索引上的锁，等待PK索引上的锁；而事务2持有PK索引锁，等待partner_id二级索引上的锁，两个事务相互持有对方须要的锁资源，而没法往前推动，形成死锁。单从死锁信息来看，咱们可能会比较疑惑，每一个事务只有一个语句，为何一样的语句，对二级索引和主键的加锁顺序会不一样？优化

产生死锁的缘由

首先咱们来看看语句的执行计划，spa

语句的type是index_merge，Extra的信息是Using intersect(customerid,partnerid)，从而咱们得知语句执行计划走了index_merge优化，单个语句经过两个索引(customerid,partnerid)来提取记录集合并取交集得到最终结果集。index_merge具体算法不在此展开，基本使用场景是语句包含多个查询条件，每一个条件都单独存在索引，而单个条件的索引过滤度不高，组合起来过滤度比较高，这个时候就可能会走index_merge优化，使得单个SQL语句能够同时利用两个索引过滤。会不会与index_merge有关呢？orm

在index_merge的状况下，会致使二级索引与主键索引顺序不一致的状况吗？结合上面的死锁信息，咱们得知死锁两个的二级索引key是0x698，而主键索引key是0x21747。咱们看看究竟是哪条记录的主键和二级索引起生了死锁，blog

能够看到0x21747对应的customer_id为151069，partner_id为1688，是否是感受似曾相识，对的，第二个事务的语句查询条件就是这两个条件的组合。这说明，对于这条记录，第一个事务语句只有partnerid索引(1688)知足条件；对于第二个事务，customer_id和partner_id索引都知足条件。因为每一个语句执行时都须要利用两个二级索引，假设先使用customer_id索引扫描，而后使用partner_id索引扫描，那么对于id为0x21747的记录，事务1的partner_id=1688知足条件，加partner_id锁，而后对对应的PK索引加锁；对于事务2，对customer_id= 151069加锁，对对应的PK索引加锁，而后对partner_id=1688索引加锁。那么对partner_id二级索引和PK主键索引在两个事务的上锁顺序是相反的，因此致使了死锁。对于id为0x21747记录：索引

序号	事务1	事务2
1	customer_id 不知足条件不加锁	customer_id= 151069 加锁
2	partner_id=1688加锁	PK=0x21747加锁
3	PK=0x21747加锁	partner_id=1688加锁
4		PK=0x21747加锁

表格第2步和第3步，两个事务的加锁顺序是相反的，致使了死锁发生。事务

如何避免死锁

前面啰啰嗦嗦讲了一个死锁案例的前因后果，但仅仅是产生死锁的一种状况。生产环境中，咱们固然不须要死锁频繁发生，毕竟是须要部分事务回滚才能解锁的，下面介绍几个简单的原则，有助于减小死锁的发生。资源

1) 尽可能按顺序加锁，从源头避免死锁
2）选择合适的隔离级别，隔离级别越高，并发冲突越激烈，实际场景Read-Committed就够用了
3）避免使用大事务，根据二段锁原则，只有事务结束(提交或回滚)才会释放锁，持有的锁越多，可能致使的冲突越大
4）为表添加合适的索引，避免走不到索引致使对每条记录都加锁

1. MYSQL index_merge导致的死锁分析
2. Jvm排查死锁
3. Java死锁的排查
4. sql server 死锁排查
5. 一次死锁排查
6. innodb next-key lock引起的死锁
7. update引起的死锁问题
8. MySQL并发引起的死锁问题
9. Mysql死锁如何排查：insert on duplicate死锁一次排查分析过程
10. 一次mysql死锁的排查过程
更多相关文章...
• ADO 排序 - ADO 教程
• Hibernate悲观锁 - Hibernate教程
• 漫谈MySQL的锁机制
• 算法总结-二分查找法