对mysql explain讲的比较清楚的

时间 2019-11-05

原文原文链接

对mysql explain讲的比较清楚的

在 explain的帮助下，您就知道何时该给表添加索引，以使用索引来查找记录从而让select 运行更快。
若是因为不恰当使用索引而引发一些问题的话，能够运行 analyze table来更新该表的统计信息，例如键的基数，它能帮您在优化方面作出更好的选择。

explain 返回了一行记录，它包括了 select语句中用到的各个表的信息。这些表在结果中按照mysql即将执行的查询中读取的顺序列出来。mysql用一次扫描屡次链接（single- sweep,multi-join）的方法来解决链接。这意味着mysql从第一个表中读取一条记录，而后在第二个表中查找到对应的记录，而后在第三个表中查找，依次类推。当全部的表都扫描完了，它输出选择的字段而且回溯全部的表，直到找不到为止，由于有的表中可能有多条匹配的记录下一条记录将从该表读取，再从下一个表开始继续处理。
在mysql version 4.1中，explain输出的结果格式改变了，使得它更适合例如 union语句、子查询以及派生表的结构。更使人注意的是，它新增了2个字段： id和 select_type。当你使用早于mysql4.1的版本就看不到这些字段了。
explain结果的每行记录显示了每一个表的相关信息，每行记录都包含如下几个字段：

id
本次 select 的标识符。在查询中每一个 select都有一个顺序的数值。
select_type
select 的类型，可能会有如下几种：
simple: 简单的 select （没有使用 union或子查询）

primary: 最外层的 select。

union: 第二层，在select 以后使用了 union。

dependent union: union 语句中的第二个select，依赖于外部子查询

subquery: 子查询中的第一个 select

dependent subquery: 子查询中的第一个 subquery依赖于外部的子查询

derived: 派生表 select（from子句中的子查询）

table
记录查询引用的表。

type
表链接类型。如下列出了各类不一样类型的表链接，依次是从最好的到最差的：

system:表只有一行记录（等于系统表）。这是 const表链接类型的一个特例。

const:表中最多只有一行匹配的记录，它在查询一开始的时候就会被读取出来。因为只有一行记录，在余下的优化程序里该行记录的字段值能够被看成是一个恒定值。const表查询起来很是快，由于只要读取一次！const 用于在和 primary key 或unique 索引中有固定值比较的情形。下面的几个查询中，tbl_name 就是 c表了：
select * from tbl_name where primary_key=1; select * from tbl_namewhere primary_key_part1=1 and primary_key_part2=2;

eq_ref:从该表中会有一行记录被读取出来以和从前一个表中读取出来的记录作联合。与const类型不一样的是，这是最好的链接类型。它用在索引全部部分都用于作链接而且这个索引是一个primary key 或 unique 类型。eq_ref能够用于在进行"="作比较时检索字段。比较的值能够是固定值或者是表达式，表达示中可使用表里的字段，它们在读表以前已经准备好了。如下的几个例子中，mysql使用了eq_ref 链接来处理 ref_table：

select * from ref_table,other_table whereref_table.key_column=other_table.column; select * fromref_table,other_table whereref_table.key_column_part1=other_table.column andref_table.key_column_part2=1;

ref: 该表中全部符合检索值的记录都会被取出来和从上一个表中取出来的记录做联合。ref用于链接程序使用键的最左前缀或者是该键不是 primary key 或 unique索引（换句话说，就是链接程序没法根据键值只取得一条记录）的状况。当根据键值只查询到少数几条匹配的记录时，这就是一个不错的链接类型。 ref还能够用于检索字段使用 =操做符来比较的时候。如下的几个例子中，mysql将使用 ref 来处理ref_table：
select * from ref_table where key_column=expr; select * fromref_table,other_table whereref_table.key_column=other_table.column; select * fromref_table,other_table whereref_table.key_column_part1=other_table.column andref_table.key_column_part2=1;

ref_or_null: 这种链接类型相似 ref，不一样的是mysql会在检索的时候额外的搜索包含null 值的记录。这种链接类型的优化是从mysql4.1.1开始的，它常常用于子查询。在如下的例子中，mysql使用ref_or_null 类型来处理 ref_table：
select * from ref_table where key_column=expr or key_column is null;

unique_subquery: 这种类型用例如一下形式的 in 子查询来替换 ref：
value in (select primary_key from single_table where some_expr)

unique_subquery: 只是用来彻底替换子查询的索引查找函数效率更高了。

index_subquery: 这种链接类型相似 unique_subquery。它用子查询来代替in，不过它用于在子查询中没有惟一索引的状况下，例如如下形式：
value in (select key_column from single_table where some_expr)

range: 只有在给定范围的记录才会被取出来，利用索引来取得一条记录。key字段表示使用了哪一个索引。key_len字段包括了使用的键的最长部分。这种类型时 ref 字段值是 null。range用于将某个字段和一个定植用如下任何操做符比较时 =, <>, >,>=, <, <=, is null, <=>, between, 或 in：
select * from tbl_name where key_column = 10; select * fromtbl_name where key_column between 10 and 20; select * from tbl_namewhere key_column in (10,20,30); select * from tbl_name wherekey_part1= 10 and key_part2 in (10,20,30);

index: 链接类型跟 all 同样，不一样的是它只扫描索引树。它一般会比 all快点，由于索引文件一般比数据文件小。mysql在查询的字段知识单独的索引的一部分的状况下使用这种链接类型。

all: 将对该表作所有扫描以和从前一个表中取得的记录做联合。这时候若是第一个表没有被标识为const的话就不大好了，在其余状况下一般是很是糟糕的。正常地，能够经过增长索引使得能从表中更快的取得记录以免all。

possible_keys
possible_keys字段是指 mysql在搜索表记录时可能使用哪一个索引。注意，这个字段彻底独立于explain 显示的表顺序。这就意味着 possible_keys里面所包含的索引可能在实际的使用中没用到。若是这个字段的值是null，就表示没有索引被用到。这种状况下，就能够检查 where子句中哪些字段那些字段适合增长索引以提升查询的性能。就这样，建立一下索引，而后再用explain 检查一下。详细的查看章节"14.2.2 alter tablesyntax"。想看表都有什么索引，能够经过 show index from tbl_name来看。

key
key字段显示了mysql实际上要用的索引。当没有任何索引被用到的时候，这个字段的值就是null。想要让mysql强行使用或者忽略在 possible_keys字段中的索引列表，能够在查询语句中使用关键字force index, use index,或 ignore index。若是是 myisam 和 bdb 类型表，可使用 analyzetable 来帮助分析使用使用哪一个索引更好。若是是 myisam类型表，运行命令 myisamchk --analyze也是同样的效果。详细的能够查看章节"14.5.2.1 analyze tablesyntax"和"5.7.2 table maintenance and crash recovery"。

key_len
key_len 字段显示了mysql使用索引的长度。当 key 字段的值为 null时，索引的长度就是 null。注意，key_len的值能够告诉你在联合索引中mysql会真正使用了哪些索引。

ref
ref 字段显示了哪些字段或者常量被用来和 key配合从表中查询记录出来。

rows
rows 字段显示了mysql认为在查询中应该检索的记录数。

extra

本字段显示了查询中mysql的附加信息。如下是这个字段的几个不一样值的解释：

distinct:mysql当找到当前记录的匹配联合结果的第一条记录以后，就再也不搜索其余记录了。

not exists:mysql在查询时作一个 left join优化时，当它在当前表中找到了和前一条记录符合 left join条件后，就再也不搜索更多的记录了。下面是一个这种类型的查询例子：
select * from t1 left join t2 on t1.id=t2.id where t2.id isnull;

假使 t2.id 定义为 not null。这种状况下，mysql将会扫描表 t1而且用 t1.id 的值在 t2 中查找记录。当在 t2中找到一条匹配的记录时，这就意味着 t2.id 确定不会都是null，就不会再在 t2 中查找相同 id值的其余记录了。也能够这么说，对于 t1 中的每一个记录，mysql只须要在t2 中作一次查找，而无论在 t2 中实际有多少匹配的记录。

range checked for each record (index map: #)

mysql没找到合适的可用的索引。取代的办法是，对于前一个表的每个行链接，它会作一个检验以决定该使用哪一个索引（若是有的话），而且使用这个索引来从表里取得记录。这个过程不会很快，但总比没有任何索引时作表链接来得快。

using filesort: mysql须要额外的作一遍从而以排好的顺序取得记录。排序程序根据链接的类型遍历全部的记录，而且将全部符合 where条件的记录的要排序的键和指向记录的指针存储起来。这些键已经排完序了，对应的记录也会按照排好的顺序取出来。详情请看"7.2.9how mysql optimizes order by"。
using index

字段的信息直接从索引树中的信息取得，而再也不去扫描实际的记录。这种策略用于查询时的字段是一个独立索引的一部分。

using temporary: mysql须要建立临时表存储结果以完成查询。这种状况一般发生在查询时包含了groupby 和 order by 子句，它以不一样的方式列出了各个字段。
using where

where子句将用来限制哪些记录匹配了下一个表或者发送给客户端。除非你特别地想要取得或者检查表种的全部记录，不然的话当查询的extra 字段值不是 using where 而且表链接类型是 all 或 index时可能表示有问题。

若是你想要让查询尽量的快，那么就应该注意 extra 字段的值为usingfilesort 和 using temporary 的状况。

你能够经过 explain 的结果中 rows字段的值的乘积大概地知道本次链接表现如何。它能够粗略地告诉咱们mysql在查询过程当中会查询多少条记录。若是是使用系统变量 max_join_size 来取得查询结果，这个乘积还能够用来肯定会执行哪些多表select 语句。
下面的例子展现了如何经过 explain提供的信息来较大程度地优化多表联合查询的性能。
假设有下面的 select 语句，正打算用 explain 来检测：
explain select tt.ticketnumber, tt.timein, tt.projectreference,tt.estimatedshipdate, tt.actualshipdate, tt.clientid,tt.servicecodes, tt.repetitiveid, tt.currentprocess,tt.currentdppers tt.recordvolume, tt.dpprinted, et.country,et_1.country, do.custname from tt, et, et as et_1, do wherett.submittime is null and tt.actualpc = et.employid andtt.assignedpc = et_1.employid and tt.clientid = do.custnmbr;

在这个例子中，先作如下假设：

要比较的字段定义以下：
table column columntype
tt actualpc char(10)
tt assignedpc char(10)
tt clientid char(10)
et employid char(15)
do custnmbr char(15)

数据表的索引以下：
table index
tt actualpc
tt assignedpc
tt clientid
et employid (primary key)
do custnmbr (primary key)

tt.actualpc 的值是不均匀分布的。

在任何优化措施未采起以前，通过 explain分析的结果显示以下：
table type possible_keys key key_len ref rows extra
et all primarynull null null 74
do all primary null null null 2135
et_1 allprimary null null null 74
tt all assignedpc, null null null 3872 clientid, actualpc range checked for each record (key map: 35)

因为字段 type 的对于每一个表值都是all，这个结果意味着mysql对全部的表作一个迪卡尔积；这就是说，每条记录的组合。这将须要花很长的时间，由于须要扫描每一个表总记录数乘积的总和。在这状况下，它的积是74 * 2135 * 74 * 3872 = 45,268,558,720条记录。若是数据表更大的话，你能够想象一下须要多长的时间。
在这里有个问题是当字段定义同样的时候，mysql就能够在这些字段上更快的是用索引（对isam类型的表来讲，除非字段定义彻底同样，不然不会使用索引）。在这个前提下，varchar和 char是同样的除非它们定义的长度不一致。因为 tt.actualpc 定义为char(10)，et.employid 定义为 char(15)，两者长度不一致。
为了解决这个问题，须要用 alter table 来加大 actualpc的长度从10到15个字符：
mysql> alter table tt modify actualpc varchar(15);

如今 tt.actualpc 和 et.employid 都是 varchar(15)
了。再来执行一次 explain 语句看看结果：
table type possible_keys key key_len ref rows extra
tt allassignedpc, null null null 3872 using clientid, where actualpc
do all primary null null null 2135 range checked for each record (keymap: 1)
et_1 all primary null null null 74 range checked for eachrecord (key map: 1) et eq_ref primary primary 15 tt.actualpc 1

这还不够，它还能够作的更好：如今 rows值乘积已经少了74倍。此次查询须要用2秒钟。
第二个改变是消除在比较 tt.assignedpc = et_1.employid 和 tt.clientid= do.custnmbr 中字段的长度不一致问题：
mysql> alter table tt modify assignedpc varchar(15), ->modify clientid varchar(15);

如今 explain 的结果以下：
table type possible_keys key key_len ref rows extra
et all primary null null null 74
tt ref assignedpc, actualpc 15 et.employid 52 using clientid, where actualpc
et_1 eq_ref primary primary 15 tt.assignedpc 1
do eq_ref primary primary 15 tt.clientid 1

这看起来已是能作的最好的结果了。
遗留下来的问题是，mysql默认地认为字段 tt.actualpc的值是均匀分布的，然而表 tt并不是如此。幸亏，咱们能够很方便的让mysql分析索引的分布：
mysql> analyze table tt;

到此为止，表链接已经优化的很完美了，explain 的结果以下：
table type possible_keys key key_len ref rows extra
tt all assignedpc null null null 3872 using clientid, where actualpc
et eq_ref primary primary 15 tt.actualpc 1
et_1 eq_ref primary primary 15 tt.assignedpc 1
do eq_ref primary primary 15 tt.clientid 1

请注意，explain 结果中的 rows字段的值也是mysql的链接优化程序大体猜想的，请检查这个值跟真实值是否基本一致。若是不是，能够经过在select 语句中使用 straight_join 来取得更好的性能，同时能够试着在from分句中用不一样的次序列出各个表。

详解： http://www.blogjava.net/persister/archive/2008/10/27/236813.html