咱们常常使用 MySQL 的执行计划来查看 SQL 语句的执行效率,接下来分析执行计划的各个显示内容。mysql
EXPLAIN SELECT * FROM users WHERE id IN (SELECT userID FROMuser_address WHERE address = "湖南长沙麓谷") ;sql
select 查询的序列号,标识执行的顺序数据库
查询的类型,主要是用于区分普通查询、联合查询、子查询等。oop
对于 UNION 和 UNION RESULT 能够经过下面的例子展示:性能
EXPLAIN SELECT * FROM users WHERE id IN(1, 2) UNION
SELECT * FROM users WHERE id IN(3, 4);优化
查询涉及到的表。spa
访问类型,SQL 查询优化中一个很重要的指标,结果值从好到坏依次是:system > const > eq_ref > ref > range > index > ALL。3d
下面经过举例说明。code
explain select * from mysql.time_zone;blog
上例中,从系统库 MySQL 的系统表 time_zone 里查询数据,访问类型为 system,这些数据已经加载到内存里,不须要进行磁盘 IO,这类扫描是速度最快的。
explain select * from (select * from user where id=1) tmp;
再举一个例子,内层嵌套(const)返回了一个临时表,外层嵌套从临时表查询,其扫描类型也是 system,也不须要走磁盘 IO,速度超快。
数据准备:
CREATE TABLE `user` (
`id` int(11) NOT NULL,
`NAME` varchar(20) DEFAULT NULL, PRIMARY KEY (`id`)
) ENGINE=InnoDB DEFAULT CHARSET=utf8; insert into user values(1,'shenjian'); insert into user values(2,'zhangsan'); insert into user values(3,'lisi');
explain select * from user where id=1;
const 扫描的条件为:
如上例,id 是 主键索引,链接部分是常量1。
数据准备:
CREATE TABLE `user` (
`id` int(11) NOT NULL,
`NAME` varchar(20) DEFAULT NULL, PRIMARY KEY (`id`)
) ENGINE=InnoDB DEFAULT CHARSET=utf8; insert into user values(1,'shenjian'); insert into user values(2,'zhangsan'); insert into user values(3,'lisi'); CREATE TABLE `user_ex` (
`id` int(11) NOT NULL,
`age` int(11) DEFAULT NULL, PRIMARY KEY (`id`)
) ENGINE=InnoDB DEFAULT CHARSET=utf8; insert into user_ex values(1,18); insert into user_ex values(2,20); insert into user_ex values(3,30); insert into user_ex values(4,40); insert into user_ex values(5,50);
EXPLAIN SELECT * FROM USER,user_ex WHERE user.id=user_ex.id;
eq_ref 扫描的条件为,对于前表的每一行(row),后表只有一行被扫描。
再细化一点:
如上例,id 是主键,该 join 查询为 eq_ref 扫描。
数据准备:
CREATE TABLE `user` (
`id` int(11) DEFAULT NULL,
`name` varchar(20) DEFAULT NULL, KEY `id` (`id`)
) ENGINE=InnoDB DEFAULT CHARSET=utf8; insert into user values(1,'shenjian'); insert into user values(2,'zhangsan'); insert into user values(3,'lisi'); CREATE TABLE `user_ex` (
`id` int(11) DEFAULT NULL,
`age` int(11) DEFAULT NULL, KEY `id` (`id`)
) ENGINE=InnoDB DEFAULT CHARSET=utf8; insert into user_ex values(1,18); insert into user_ex values(2,20); insert into user_ex values(3,30); insert into user_ex values(4,40); insert into user_ex values(5,50);
EXPLAIN SELECT * FROM USER,user_ex WHERE user.id=user_ex.id;
若是把上例 eq_ref 案例中的主键索引,改成普通非惟一(non unique)索引。就由 eq_ref 降级为了 ref,此时对于前表的每一行(row),后表可能有多于一行的数据被扫描。
select * from user where id=1;
当 id 改成普通非惟一索引后,常量的链接查询,也由 const 降级为了 ref,由于也可能有多于一行的数据被扫描。
ref 扫描,可能出如今 join 里,也可能出如今单表普通索引里,每一次匹配可能有多行数据返回,虽然它比 eq_ref 要慢,但它仍然是一个很快的 join 类型。
数据准备:
CREATE TABLE `user` (
`id` int(11) NOT NULL,
`name` varchar(20) DEFAULT NULL, PRIMARY KEY (`id`)
) ENGINE=InnoDB DEFAULT CHARSET=utf8; insert into user values(1,'shenjian'); insert into user values(2,'zhangsan'); insert into user values(3,'lisi'); insert into user values(4,'wangwu'); insert into user values(5,'zhaoliu');
explain select * from user where id between 1 and 4;
explain select * from user where id in(1,2,3);
explain select * from user where id > 3;
range 扫描就比较好理解了,它是索引上的范围查询,它会在索引上扫码特定范围内的值。
像上例中的 between,in,> 都是典型的范围(range)查询。
explain count (*) from user;
如上例,id 是主键,该 count 查询须要经过扫描索引上的所有数据来计数,它仅比全表扫描快一点。
数据准备:
CREATE TABLE `user` (
`id` int(11) DEFAULT NULL,
`name` varchar(20) DEFAULT NULL ) ENGINE=InnoDB DEFAULT CHARSET=utf8; insert into user values(1,'shenjian'); insert into user values(2,'zhangsan'); insert into user values(3,'lisi'); CREATE TABLE `user_ex` (
`id` int(11) DEFAULT NULL,
`age` int(11) DEFAULT NULL ) ENGINE=InnoDB DEFAULT CHARSET=utf8; insert into user_ex values(1,18); insert into user_ex values(2,20); insert into user_ex values(3,30); insert into user_ex values(4,40); insert into user_ex values(5,50);
explain select * from user,user_ex where user.id=user_ex.id;
若是 id 上不建索引,对于前表的每一行(row),后表都要被全表扫描。
文章中,这个相同的 join 语句出现了三次:
有此可见,创建正确的索引,对数据库性能的提高是多么重要。
查询过程当中有可能用到的索引。
实际使用的索引,若是为 NULL ,则没有使用索引。
根据表统计信息或者索引选用状况,大体估算出找到所需的记录所须要读取的行数。
表示返回结果的行数占需读取行数的百分比, filtered 的值越大越好。
十分重要的额外信息。
下面经过举例说明。
数据准备:
CREATE TABLE `user` (
`id` int(11) NOT NULL,
`name` varchar(20) DEFAULT NULL,
`sex` varchar(5) DEFAULT NULL, PRIMARY KEY (`id`), KEY `name` (`name`)
) ENGINE=InnoDB DEFAULT CHARSET=utf8mb4; insert into user values(1, 'shenjian','no'); insert into user values(2, 'zhangsan','no'); insert into user values(3, 'lisi', 'yes'); insert into user values(4, 'lisi', 'no');
数听说明:
用户表:id 主键索引,name 普通索引(非惟一),sex 无索引。
四行记录:其中 name 普通索引存在重复记录 lisi。
explain select * from user order by sex;
Extra 为 Using filesort 说明,获得所需结果集,须要对全部记录进行文件排序。
这类 SQL 语句性能极差,须要进行优化。
典型的,在一个没有创建索引的列上进行了 order by,就会触发 filesort,常见的优化方案是,在 order by 的列上添加索引,避免每次查询都全量排序。
explain select * from user group by name order by sex;
Extra 为 Using temporary 说明,须要创建临时表(temporary table)来暂存中间结果。
这类 SQL 语句性能较低,每每也须要进行优化。
典型的 group by 和 order by 同时存在,且做用于不一样的字段时,就会创建临时表,以便计算出最终的结果集。
临时表存在两种引擎,一种是 Memory 引擎,一种是 MyISAM 引擎,若是返回的数据在 16M 之内(默认),且没有大字段的状况下,使用 Memory 引擎,不然使用 MyISAM 引擎。
EXPLAIN SELECT id FROM USER;
Extra 为 Using index 说明,SQL 所须要返回的全部列数据均在一棵索引树上,而无需访问实际的行记录。
这类 SQL 语句每每性能较好。
explain select id, name, sex from user where name='shenjian';
Extra 为 Using index condition 说明,确实命中了索引,但不是全部的列数据都在索引树上,还须要访问实际的行记录。
这类 SQL 语句性能也较高,但不如 Using index。
explain select * from user where sex='no';
Extra 为 Using where 说明,查询的结果集使用了 where 过滤条件,好比上面的 SQL 使用了 sex = 'no'
的过滤条件
EXPLAIN SELECT MAX(id) FROM USER;
好比上面的语句查询 id 的最大值,由于 id 是主键索引,根据 B+Tree 的结构,自然就是有序存放的,因此不须要等到执行阶段再进行计算,查询执行计划生成的阶段便可完成优化。
explain select * from user where id in (select id from user where sex='no');
Extra 为 Using join buffer (Block Nested Loop) 说明,须要进行嵌套循环计算。内层和外层的 type 均为 ALL,rows 均为4,须要循环进行4*4次计算。
这类 SQL 语句性能每每也较低,须要进行优化。
典型的两个关联表 join,关联字段均未创建索引,就会出现这种状况。常见的优化方案是,在关联字段上添加索引,避免每次嵌套循环计算。