MySQL 8.0索引合并

时间 2019-12-10

标签 mysql 8.0 索引合并栏目 MySQL 繁體版

原文原文链接

 
 简介 

  参考https://dev.mysql.com/doc/refman/8.0/en/index-merge-optimization.html#index-merge-intersection。 

  索引合并是经过多个range类型的扫描而且合并它们的结果集来检索行的。仅合并来自单个表的索引扫描，而不是跨多个表的索引扫描。合并会产生底层扫描的三种形式：unions（合并）、intersections（交集）、unions-of-intersections（先取交集再合并）。 

  如下四个例子会产生索引合并： 

 
 一、SELECT * FROM tbl_name WHERE key1 = 10 OR key2 = 20; 

 
 二、SELECT * FROM tbl_name WHERE (key1 = 10 OR key2 = 20) AND non_key = 30; 

 
 三、SELECT * FROM t1, t2 WHERE (t1.key1 IN (1,2) OR t1.key2 LIKE 'value%') AND t2.key1 = t1.some_col; 

 
 四、SELECT * FROM t1, t2 WHERE t1.key1 = 1 AND (t2.key1 = t1.some_col OR t2.key2 = t1.some_col2); 

  索引合并有如下已知的局限性： 

  一、若是查询语句包含一个带有严重AND/OR嵌套的复杂的WHERE子句而MySQL没有选择最佳计划，那么能够尝试使用如下的标志符转换： 

  (x AND y) OR z => (x OR z) AND (y OR z) 

  (x OR y) AND z => (x AND z) OR (y AND z) 

  二、索引合并不适用于全文索引。 

  在 EXPLAIN 语句输出的信息中，索引合并在type列中表现为“index_merge”，在这种状况下，key列包含使用的索引列表。 

  索引合并访问方法有几种算法，表如今 EXPLAIN 语句输出的 
 Extra字段中： 

  Using intersect(...) 

  Using union(...) 

  Using sort_union(...) 

  下面将更详细地描述这些算法。优化器根据各类可用选项的成本估计，在不一样的索引合并算法和其余访问方法之间进行选择。 

 
 Index Merge Intersection算法 

  Index Merge Intersection算法对全部使用的索引执行同步扫描，并生成从合并的索引扫描接收到的行序列的交集。 

  这种算法适用于当WHERE子句被转换成多个使用AND链接的不一样索引key上的范围条件，且条件是如下两种之一： 

  1、这种形式的N部分表达式，索引正好包括N个字段（全部索引字段都被覆盖），N>=1，N若是大于1就是复合索引： 

  key_part1 = const1 AND key_part2 = const2 ... AND key_partN = constN。 

  2、InnoDB表主键上的任何范围条件。 

  例子： 

  1.SELECT * FROM innodb_table 

  WHERE primary_key < 10 AND key_col1 = 20; 

  2.SELECT * FROM tbl_name 

  WHERE key1_part1 = 1 AND key1_part2 = 2 AND key2 = 2; 

 
 Index Merge Union算法 

  该算法相似于Index Merge Intersection算法，适用于当WHERE子句被转换成多个使用OR链接的不一样索引key上的范围条件，且条件是如下三种之一： 

  1、这种形式的N部分表达式，索引正好包括N个字段（全部索引字段都被覆盖），N>=1，N若是大于1就是复合索引： 

  key_part1 = const1 AND key_part2 = const2 ... AND key_partN = constN。 

  2、InnoDB表主键上的任何范围条件。 

  3、符合Index Merge Intersection算法的条件。 

  例子： 

  1.SELECT * FROM t1 

  WHERE key1 = 1 OR key2 = 2 OR key3 = 3; 

  2.SELECT * FROM innodb_table 

  WHERE (key1 = 1 AND key2 = 2) 

  OR (key3 = 'foo' AND key4 = 'bar') AND key5 = 5; 

 
 Index Merge Sort-Union算法 

  该算法适用于当WHERE子句被转换成多个使用OR链接的不一样索引key上的范围条件，可是不符合 Index Merge Union算法的。Index Merge Sort-Union和Index Merge Union算法的区别在于，Index Merge Sort-Union必须首先获取全部行的行id并在返回任何行以前对它们进行排序。 

  例子： 

  1.SELECT * FROM tbl_name 

  WHERE key_col1 < 10 OR key_col2 < 20; 

  2.SELECT * FROM tbl_name 

  WHERE (key_col1 > 10 OR key_col2 = 20) AND nonkey_col = 30; 

 
 索引合并引起的死锁 

  索引合并是MySQL优化查询速度的一种方式，可是错误的使用也会致使死锁，处理方式就是将引发索引合并的索引修改成复合索引。曾经就遇到过和如下所讲的几乎同样的问题，因此这里就直接把别人写的转载过来，转载自：https://blog.csdn.net/hehehaha1123/article/details/59058067。 

  ============================================================================= 

 
 概述 

  前几天排查了一个死锁问题，最开始百思不得其解，由于发生死锁的两个事务是单语句事务，语句类型相同(where属性列相同，仅值不一样)，并且语句都走了相同的索引，但最终确实发生了死锁。经过定位排查发现，问题的源头就是index_merge，死锁的缘由也很普通，两个事务加锁顺序不一样，并存在相互等待的状况。由于这个案例比较特殊，因此在此分享给你们。 

 
 死锁信息 

  拿到死锁问题，首先须要查看几个基本信息，包括死锁等待关系，表结构定义等。 

  1.表结构定义 

  Create Table: CREATE TABLE `t_xxx_customer` ( 

  `id` bigint(20) unsigned NOT NULL AUTO_INCREMENT COMMENT '主键', 

  `partner_id` bigint(20) unsigned DEFAULT NULL, 

  `customer_id` bigint(20) unsigned DEFAULT NULL, 

  `deleted` tinyint(4) DEFAULT NULL, 

  `partner_user_id` bigint(20) unsigned DEFAULT NULL, 

  `xxx_id` varchar(128) DEFAULT NULL, 

  `xxx_name` varchar(256) DEFAULT NULL, 

  PRIMARY KEY (`id`), 

  KEY `partner_id` (`partner_id`), 

  KEY `customer_id` (`customer_id`), 

  KEY `partner_user_id` (`partner_user_id`) 

  ) ENGINE=InnoDB AUTO_INCREMENT=140249 DEFAULT CHARSET=utf8; 

  2.死锁信息提取与分析 

  经过show engine innodb status;命令能够获取innodb引擎中最近一次发生死锁的信息，信息以下: 

  *** (1) TRANSACTION: UPDATE t_xxx_customer SET xxx_id='101', xxx_name='bbb' where customer_id=235646 and partner_id=1688 and deleted=0; 

  *** (1) HOLDS THE LOCK(S): RECORD LOCKS space id 1640 page no 3947 n bits 432 index partner_id of table xxx.t_xxx_customer trx id 2625291980 lock_mode X locks rec but not gap Record lock, heap no 334 PHYSICAL RECORD: n_fields 2; compact format; info bits 0 0: len 8; hex 0000000000000698; asc ;; 1: len 8; hex 0000000000021747; asc G;; 

  *** (1) WAITING FOR THIS LOCK TO BE GRANTED: RECORD LOCKS space id 1640 page no 3395 n bits 160 index PRIMARY of table t_xxx_customer trx id 2625291980 lock_mode X locks rec but not gap waiting Record lock, heap no 89 PHYSICAL RECORD: n_fields 25; compact format; info bits 0 

  *** (2) TRANSACTION: UPDATE t_xxx_customer SET xxx_id='102', xxx_name='aaa' where customer_id=151069 and partner_id=1688 and deleted=0; 

  *** (2) HOLDS THE LOCK(S): RECORD LOCKS space id 1640 page no 3395 n bits 160 index PRIMARY of table xxx.t_xxx_customer trx id 2625291981 lock_mode X locks rec but not gap 

  *** (2) WAITING FOR THIS LOCK TO BE GRANTED: RECORD LOCKS space id 1640 page no 3947 n bits 432 index partner_id of table xxx.t_xxx_customer trx id 2625291981 lock_mode X locks rec but not gap waiting Record lock, heap no 334 PHYSICAL RECORD: n_fields 2; compact format; info bits 0 0: len 8; hex 0000000000000698; asc ;; 1: len 8; hex 0000000000021747; asc G;; 

  *** WE ROLL BACK TRANSACTION (2) 

  从死锁结果来看，咱们很容易看到事务1持有 partner_id二级索引上的锁，等待PK索引上的锁；而事务2持有PK索引锁，等待partner_id二级索引上的锁，两个事务相互持有对方须要的锁资源，而没法往前推动，形成死锁。单从死锁信息来看，咱们可能会比较疑惑，每一个事务只有一个语句，为何一样的语句，对二级索引和主键的加锁顺序会不一样？ 

 
 产生死锁的缘由 

  首先咱们来看看语句的执行计划， 

  语句的type是index_merge，Extra的信息是Using intersect(customerid,partnerid)，从而咱们得知语句执行计划走了index_merge优化，单个语句经过两个索引(customerid,partnerid)来提取记录集合并取交集得到最终结果集。index_merge具体算法不在此展开，基本使用场景是语句包含多个查询条件，每一个条件都单独存在索引，而单个条件的索引过滤度不高，组合起来过滤度比较高，这个时候就可能会走index_merge优化，使得单个SQL语句能够同时利用两个索引过滤。会不会与index_merge有关呢？ 

  在index_merge的状况下，会致使二级索引与主键索引顺序不一致的状况吗？结合上面的死锁信息，咱们得知死锁两个的二级索引key是0x698，而主键索引key是0x21747。咱们看看究竟是哪条记录的主键和二级索引起生了死锁， 

  能够看到0x21747对应的customer_id为151069，partner_id为1688，是否是感受似曾相识，对的，第二个事务的语句查询条件就是这两个条件的组合。这说明，对于这条记录，第一个事务语句只有partnerid索引(1688)知足条件；对于第二个事务，customer_id和partner_id索引都知足条件。因为每一个语句执行时都须要利用两个二级索引，假设先使用customer_id索引扫描，而后使用partner_id索引扫描，那么对于id为0x21747的记录，事务1的partner_id=1688知足条件，加partner_id锁，而后对对应的PK索引加锁；对于事务2，对customer_id= 151069加锁，对对应的PK索引加锁，而后对partner_id=1688索引加锁。那么对partner_id二级索引和PK主键索引在两个事务的上锁顺序是相反的，因此致使了死锁。对于id为0x21747记录： 

序号	事务1	事务2
1	customer_id 不知足条件不加锁	customer_id= 151069 加锁
2	partner_id=1688加锁	PK=0x21747加锁
3	PK=0x21747加锁	partner_id=1688加锁
4		PK=0x21747加锁

  表格第2步和第3步，两个事务的加锁顺序是相反的，致使了死锁发生。 

  =============================================================================