MySQL-4- 索引及执行计划

时间 2019-11-13

标签 mysql 索引执行计划栏目 MySQL 繁體版

原文原文链接

1. 索引做用

提供了相似于书中目录的做用,目的是为了优化查询

2. 索引的种类(算法)

B树索引 Hash索引 R树 Full text GIS

3. B树基于不一样的查找算法分类介绍

B-tree B+Tree 在范围查询方面提供了更好的性能(> < >= <= like) B*Tree

4. 在功能上的分类

4.1 辅助索引(S)怎么构建B树结构的?

(1). 索引是基于表中,列(索引键)的值生成的B树结构 (2). 首先提取此列全部的值,进行自动排序 (3). 将排好序的值,均匀的分布到索引树的叶子节点中(16K) (4). 而后生成此索引键值所对应得后端数据页的指针 (5). 生成枝节点和根节点,根据数据量级和索引键长度,生成合适的索引树高度 id name age gender select * from t1 where id=10; 问题: 基于索引键作where查询,对于id列是顺序IO,可是对于其余列的查询,多是随机IO.

4.2 汇集索引(C)

4.2.1 前提

(1)表中设置了主键,主键列就会自动被做为汇集索引. (2)若是没有主键,会选择惟一键做为汇集索引. (3)汇集索引必须在建表时才有意义,通常是表的无关列(ID)

4.2.2 辅助索引(S)怎么构建B树结构的?

(1) 在建表时,设置了主键列(ID) (2) 在未来录入数据时,就会按照ID列的顺序存储到磁盘上.(咱们又称之为汇集索引组织表) (3) 将排好序的整行数据,生成叶子节点.能够理解为,磁盘的数据页就是叶子节点

4.2.3 汇集索引和辅助索引构成区别

汇集索引只能有一个,非空惟一,通常时主键 辅助索引,能够有多个,是配合汇集索引使用的 汇集索引叶子节点,就是磁盘的数据行存储的数据页 MySQL是根据汇集索引,组织存储数据,数据存储时就是按照汇集索引的顺序进行存储数据 辅助索引,只会提取索引键值,进行自动排序生成B树结构

5.辅助索引细分

1.普通的单列辅助索引 2.联合索引 多个列做为索引条件,生成索引树,理论上设计的好的,能够减小大量的回表 查询 3.惟一索引 索引列的值都是惟一的.

6. 关于索引树的高度受什么影响

1. 数据量级, 解决方法:分表,分库,分布式 2. 索引列值过长 , 解决方法:前缀索引 3. 数据类型: 变长长度字符串,使用了char,解决方案:变长字符串使用varchar enum类型的使用enum ('山东','河北','黑龙江','吉林','辽宁','陕西'......) 1 2 3

7. 索引的基本管理

7.1 索引创建前

db01 [world]>desc city; +-------------+----------+------+-----+---------+----------------+ | Field | Type | Null | Key | Default | Extra | +-------------+----------+------+-----+---------+----------------+ | ID | int(11) | NO | PRI | NULL | auto_increment | | Name | char(35) | NO | | | | | CountryCode | char(3) | NO | MUL | | | | District | char(20) | NO | | | | | Population | int(11) | NO | | 0 | | +-------------+----------+------+-----+---------+----------------+ 5 rows in set (0.00 sec) Field :列名字 key :有没有索引,索引类型 PRI: 主键索引 UNI: 惟一索引 MUL: 辅助索引(单列,联和,前缀)

7.1 单列普通辅助索引

7.1.1 建立索引

db01 [world]>alter table city add index idx_name(name); 表 索引名（列名） db01 [world]>create index idx_name1 on city(name); db01 [world]>show index from city;  注意: 以上操做不表明生产操做,咱们不建议在一个列上建多个索引同一个表中，索引名不能同名。
 ### 7.1.2 删除索引: db01 [world]>alter table city drop index idx_name1; 表名 索引名

7.2 覆盖索引(联合索引)

Master [world]>alter table city add index idx_co_po(countrycode,population);

7.3 前缀索引

db01 [world]>alter table city add index idx_di(district(5)); 注意：数字列不能用做前缀索引。

7.4 惟一索引

db01 [world]>alter table city add unique index idx_uni1(name); ERROR 1062 (23000): Duplicate entry 'San Jose' for key 'idx_uni1'

统计city表中，以省的名字为分组，统计组的个数javascript

select district,count(id) from city group by district; 需求: 找到world下,city表中 name列有重复值的行,最后删掉重复的行 db01 [world]>select name,count(id) as cid from city group by name having cid>1 order by cid desc; db01 [world]>select * from city where name='suzhou';

===============================================php

8. 执行计划获取及分析

8.0 介绍

(1)获取到的是优化器选择完成的,他认为代价最小的执行计划. 做用: 语句执行前,先看执行计划信息,能够有效的防止性能较差的语句带来的性能问题. 若是业务中出现了慢语句，咱们也须要借助此命令进行语句的评估，分析优化方案。 (2) select 获取数据的方法 1. 全表扫描(应当尽可能避免,由于性能低) 2. 索引扫描 3. 获取不到数据

8.1 执行计划获取

获取优化器选择后的执行计划css

image

8.2 执行计划分析

8.2.0 重点关注的信息

table: city 　---->查询操做的表 ** possible_keys: CountryCode,idx_co_po 　---->可能会走的索引 ** key: CountryCode 　　　　　　　　　　　　---->真正走的索引 *** type: ref 　　　　　　　　　　　　　　　 ---->索引类型 ***** Extra: Using index condition ---->额外信息 *****

8.2.1 type详解

从左到右性能依次变好. ALL : 全表扫描,不走索引 例子: 1. 查询条件列,没有索引 SELECT * FROM t_100w WHERE k2='780P'; 2. 查询条件出现如下语句(辅助索引列) USE world DESC city; DESC SELECT * FROM city WHERE countrycode <> 'CHN'; DESC SELECT * FROM city WHERE countrycode NOT IN ('CHN','USA'); DESC SELECT * FROM city WHERE countrycode LIKE '%CH%'; 注意:对于汇集索引列,使用以上语句,依然会走索引 DESC SELECT * FROM city WHERE id <> 10; INDEX : 全索引扫描 1. 查询须要获取整个索引树种的值时: DESC SELECT countrycode FROM city; 2. 联合索引中,任何一个非最左列做为查询条件时: idx_a_b_c(a,b,c) ---> a ab abc SELECT * FROM t1 WHERE b SELECT * FROM t1 WHERE c RANGE : 索引范围扫描 辅助索引> < >= <= LIKE IN OR 主键 <> NOT IN 例子: 1. DESC SELECT * FROM city WHERE id<5; 2. DESC SELECT * FROM city WHERE countrycode LIKE 'CH%'; 3. DESC SELECT * FROM city WHERE countrycode IN ('CHN','USA'); 注意: 1和2例子中,能够享受到B+树的优点,可是3例子中是不能享受的. 因此,咱们能够将3号列子改写: DESC SELECT * FROM city WHERE countrycode='CHN' UNION ALL SELECT * FROM city WHERE countrycode='USA'; ref: 非惟一性索引,等值查询 DESC SELECT * FROM city WHERE countrycode='CHN'; eq_ref: 在多表链接时,链接条件使用了惟一索引(uk pK) DESC SELECT b.name,a.name FROM city AS a JOIN country AS b ON a.countrycode=b.code WHERE a.population <100; DESC country system,const : 惟一索引的等值查询 DESC SELECT * FROM city WHERE id=10;

8.2.2 其余字段解释

extra: filesort ,文件排序. SHOW INDEX FROM city; ALTER TABLE city ADD INDEX CountryCode(CountryCode); ALTER TABLE city DROP INDEX idx_c_p; DESC SELECT * FROM city WHERE countrycode='CHN' ORDER BY population ALTER TABLE city ADD INDEX idx_(population); DESC SELECT * FROM city WHERE countrycode='CHN' ORDER BY population ALTER TABLE city ADD INDEX idx_c_p(countrycode,population); ALTER TABLE city DROP INDEX idx_; ALTER TABLE city DROP INDEX CountryCode; DESC SELECT * FROM city WHERE countrycode='CHN' ORDER BY population 结论: 1.当咱们看到执行计划extra位置出现filesort,说明由文件排序出现 2.观察须要排序(ORDER BY,GROUP BY ,DISTINCT )的条件,有没有索引 3. 根据子句的执行顺序,去建立联合索引 索引优化效果测试: 优化前: [root@db01 ~]# mysqlslap --defaults-file=/etc/my.cnf \ > --concurrency=100 --iterations=1 --create-schema='oldboy' \ > --query="select * from oldboy.t_100w where k2='780P'" engine=innodb \ > --number-of-queries=2000 -uroot -p123 -verbose mysqlslap: [Warning] Using a password on the command line interface can be insecure. Benchmark Running for engine rbose Average number of seconds to run all queries: 701.743 seconds Minimum number of seconds to run all queries: 701.743 seconds Maximum number of seconds to run all queries: 701.743 seconds Number of clients running queries: 100 Average number of queries per client: 20 优化后: [root@db01 ~]# mysqlslap --defaults-file=/etc/my.cnf --concurrency=100 --iterations=1 --create-schema='oldboy' --query="select * from oldboy.t_100w where k2='780P'" engine=innodb --number-of-queries=2000 -uroot -p123 -verbose mysqlslap: [Warning] Using a password on the command line interface can be insecure. Benchmark Running for engine rbose Average number of seconds to run all queries: 0.190 seconds Minimum number of seconds to run all queries: 0.190 seconds Maximum number of seconds to run all queries: 0.190 seconds Number of clients running queries: 100 Average number of queries per client: 20 联合索引: 1. SELECT * FROM t1 WHERE a= b= 咱们创建联合索引时: ALTER TABLE t1 ADD INDEX idx_a_b(a,b); ALTER TABLE t1 ADD INDEX idx_b_a(b,a); 以上的查询不考虑索引的顺序,优化器会自动调整where的条件顺序 注意: 索引,咱们在这种状况下建索引时,须要考虑哪一个列的惟一值更多,哪一个放在索引左边. 2. 若是出现where 条件中出现不等值查询条件 DESC SELECT * FROM t_100w WHERE num <1000 AND k2='DEEF'; 咱们建索引时: ALTER TABLE t_100w ADD INDEX idx_2_n(k2,num); 语句书写时 DESC SELECT * FROM t_100w WHERE k2='DEEF' AND num <1000 ; 3. 若是查询中出现多子句 咱们要按照子句的执行顺序进行创建索引.

8.2.3 explain(desc)使用场景（面试题）

题目意思: 咱们公司业务慢,请你从数据库的角度分析缘由 1.mysql出现性能问题,我总结有两种状况: （1）应急性的慢：忽然夯住 应急状况:数据库hang(卡了,资源耗尽) 处理过程: 1.show processlist; 获取到致使数据库hang的语句 2. explain 分析SQL的执行计划,有没有走索引,索引的类型状况 3. 建索引,改语句 （2）一段时间慢(持续性的): (1)记录慢日志slowlog,分析slowlog (2)explain 分析SQL的执行计划,有没有走索引,索引的类型状况 (3)建索引,改语句

9. 索引应用规范

业务 1.产品的功能 2.用户的行为 "热"查询语句 --->较慢--->slowlog "热"数据

9.1 创建索引的原则（DBA运维规范）

9.1.0 说明

为了使索引的使用效率更高，在建立索引时，必须考虑在哪些字段上建立索引和建立什么类型的索引。那么索引设计原则又是怎样的?

9.1.1 (必须的) 建表时必定要有主键,通常是个无关列

略.回顾一下,汇集索引结构.java

9.1.2 选择惟一性索引

惟一性索引的值是惟一的，能够更快速的经过该索引来肯定某条记录。 例如，学生表中学号是具备惟一性的字段。为该字段创建惟一性索引能够很快的肯定某个学生的信息。 若是使用姓名的话，可能存在同名现象，从而下降查询速度。 优化方案: (1) 若是非得使用重复值较多的列做为查询条件(例如:男女),能够将表逻辑拆分 (2) 能够将此列和其余的查询类,作联和索引 select count(*) from world.city; select count(distinct countrycode) from world.city; select count(distinct countrycode,population ) from world.city;

9.1.3(必须的) 为常常须要where 、ORDER BY、GROUP BY,join on等操做的字段，

排序操做会浪费不少时间。 where A B C ----》 A B C in where A group by B order by C A,B，C 若是为其创建索引，优化查询 注：若是常常做为条件的列，重复值特别多，能够创建联合索引。

9.1.4 尽可能使用前缀来索引

若是索引字段的值很长，最好使用值的前缀来索引。

9.1.5 限制索引的数目

索引的数目不是越多越好。 可能会产生的问题: (1) 每一个索引都须要占用磁盘空间，索引越多，须要的磁盘空间就越大。 (2) 修改表时，对索引的重构和更新很麻烦。越多的索引，会使更新表变得很浪费时间。 (3) 优化器的负担会很重,有可能会影响到优化器的选择. percona-toolkit中有个工具,专门分析索引是否有用

9.1.6 删除再也不使用或者不多使用的索引(percona toolkit)

pt-duplicate-key-checker 表中的数据被大量更新，或者数据的使用方式被改变后，原有的一些索引可能再也不须要。数据库管理 员应当按期找出这些索引，将它们删除，从而减小索引对更新操做的影响。

9.1.7 大表加索引,要在业务不繁忙期间操做

9.1.8 尽可能少在常常更新值的列上建索引

9.1.9 建索引原则

(1) 必需要有主键,若是没有能够作为主键条件的列,建立无关列 (2) 常常作为where条件列 order by group by join on, distinct 的条件(业务:产品功能+用户行为) (3) 最好使用惟一值多的列做为索引,若是索引列重复值较多,能够考虑使用联合索引 (4) 列值长度较长的索引列,咱们建议使用前缀索引. (5) 下降索引条目,一方面不要建立没用索引,不常使用的索引清理,percona toolkit(xxxxx) (6) 索引维护要避开业务繁忙期

9.2 不走索引的状况（开发规范）

9.2.1 没有查询条件，或者查询条件没有创建索引

select * from tab; 全表扫描。 select * from tab where 1=1; 在业务数据库中，特别是数据量比较大的表。 是没有全表扫描这种需求。 一、对用户查看是很是痛苦的。 二、对服务器来说毁灭性的。 （1） select * from tab; SQL改写成如下语句： select * from tab order by price limit 10 ; 须要在price列上创建索引 （2） select * from tab where name='zhangsan' name列没有索引 改： 一、换成有索引的列做为查询条件 二、将name列创建索引

9.2.2 查询结果集是原表中的大部分数据，应该是25％以上。

查询的结果集，超过了总数行数25%，优化器以为就没有必要走索引了。 假如：tab表 id，name id:1-100w ，id列有(辅助)索引 select * from tab where id>500000; 若是业务容许，可使用limit控制。 怎么改写 ？ 结合业务判断，有没有更好的方式。若是没有更好的改写方案 尽可能不要在mysql存放这个数据了。放到redis里面。

9.2.3 索引自己失效，统计数据不真实

索引有自我维护的能力。 对于表内容变化比较频繁的状况下，有可能会出现索引失效。 通常是删除重建 现象: 有一条select语句日常查询时很快,忽然有一天很慢,会是什么缘由 select? --->索引失效,，统计数据不真实 DML ? --->锁冲突

9.2.4 查询条件使用函数在索引列上，或者对索引列进行运算，运算包括(+，-，*，/，! 等)

例子： 错误的例子：select * from test where id-1=9; 正确的例子：select * from test where id=10; 算术运算 函数运算 子查询

9.2.5 隐式转换致使索引失效.这一点应当引发重视.也是开发中常常会犯的错误.

这样会致使索引失效. 错误的例子： mysql> alter table tab add index inx_tel(telnum); Query OK, 0 rows affected (0.03 sec) Records: 0 Duplicates: 0 Warnings: 0 mysql> mysql> desc tab; +--------+-------------+------+-----+---------+-------+ | Field | Type | Null | Key | Default | Extra | +--------+-------------+------+-----+---------+-------+ | id | int(11) | YES | | NULL | | | name | varchar(20) | YES | | NULL | | | telnum | varchar(20) | YES | MUL | NULL | | +--------+-------------+------+-----+---------+-------+ 3 rows in set (0.01 sec) mysql> select * from tab where telnum='1333333'; +------+------+---------+ | id | name | telnum | +------+------+---------+ | 1 | a | 1333333 | +------+------+---------+ 1 row in set (0.00 sec) mysql> select * from tab where telnum=1333333; +------+------+---------+ | id | name | telnum | +------+------+---------+ | 1 | a | 1333333 | +------+------+---------+ 1 row in set (0.00 sec) mysql> explain select * from tab where telnum='1333333'; +----+-------------+-------+------+---------------+---------+---------+-------+------+-----------------------+ | id | select_type | table | type | possible_keys | key | key_len | ref | rows | Extra | +----+-------------+-------+------+---------------+---------+---------+-------+------+-----------------------+ | 1 | SIMPLE | tab | ref | inx_tel | inx_tel | 63 | const | 1 | Using index condition | +----+-------------+-------+------+---------------+---------+---------+-------+------+-----------------------+ 1 row in set (0.00 sec) mysql> explain select * from tab where telnum=1333333; +----+-------------+-------+------+---------------+------+---------+------+------+-------------+ | id | select_type | table | type | possible_keys | key | key_len | ref | rows | Extra | +----+-------------+-------+------+---------------+------+---------+------+------+-------------+ | 1 | SIMPLE | tab | ALL | inx_tel | NULL | NULL | NULL | 2 | Using where | +----+-------------+-------+------+---------------+------+---------+------+------+-------------+ 1 row in set (0.00 sec) mysql> explain select * from tab where telnum=1555555; +----+-------------+-------+------+---------------+------+---------+------+------+-------------+ | id | select_type | table | type | possible_keys | key | key_len | ref | rows | Extra | +----+-------------+-------+------+---------------+------+---------+------+------+-------------+ | 1 | SIMPLE | tab | ALL | inx_tel | NULL | NULL | NULL | 2 | Using where | +----+-------------+-------+------+---------------+------+---------+------+------+-------------+ 1 row in set (0.00 sec) mysql> explain select * from tab where telnum='1555555'; +----+-------------+-------+------+---------------+---------+---------+-------+------+-----------------------+ | id | select_type | table | type | possible_keys | key | key_len | ref | rows | Extra | +----+-------------+-------+------+---------------+---------+---------+-------+------+-----------------------+ | 1 | SIMPLE | tab | ref | inx_tel | inx_tel | 63 | const | 1 | Using index condition | +----+-------------+-------+------+---------------+---------+---------+-------+------+-----------------------+ 1 row in set (0.00 sec) mysql>

9.2.6 <> ，not in 不走索引（辅助索引）

EXPLAIN SELECT * FROM teltab WHERE telnum <> '110'; EXPLAIN SELECT * FROM teltab WHERE telnum NOT IN ('110','119'); mysql> select * from tab where telnum <> '1555555'; +------+------+---------+ | id | name | telnum | +------+------+---------+ | 1 | a | 1333333 | +------+------+---------+ 1 row in set (0.00 sec) mysql> explain select * from tab where telnum <> '1555555'; 单独的>,<,in 有可能走，也有可能不走，和结果集有关，尽可能结合业务添加limit or或in 尽可能改为union EXPLAIN SELECT * FROM teltab WHERE telnum IN ('110','119'); 改写成： EXPLAIN SELECT * FROM teltab WHERE telnum='110' UNION ALL SELECT * FROM teltab WHERE telnum='119'

9.2.7 like "%_" 百分号在最前面不走

EXPLAIN SELECT * FROM teltab WHERE telnum LIKE '31%' 走range索引扫描 EXPLAIN SELECT * FROM teltab WHERE telnum LIKE '%110' 不走索引 %linux%类的搜索需求，可使用elasticsearch+mongodb 专门作搜索服务的数据库产品

MySQL-4- 索引及执行计划

1. 索引做用

2. 索引的种类(算法)

3. B树 基于不一样的查找算法分类介绍

4. 在功能上的分类

4.1 辅助索引(S)怎么构建B树结构的?

4.2 汇集索引(C)

4.2.1 前提

4.2.2 辅助索引(S)怎么构建B树结构的?

4.2.3 汇集索引和辅助索引构成区别

5.辅助索引细分

6. 关于索引树的高度受什么影响

7. 索引的基本管理

7.1 索引创建前

7.1 单列普通辅助索引

7.1.1 建立索引

7.2 覆盖索引(联合索引)

7.3 前缀索引

7.4 惟一索引

8. 执行计划获取及分析

8.0 介绍

8.1 执行计划获取

8.2 执行计划分析

8.2.0 重点关注的信息

8.2.1 type详解

8.2.2 其余字段解释

8.2.3 explain(desc)使用场景（面试题）

9. 索引应用规范

9.1 创建索引的原则（DBA运维规范）

9.1.0 说明

9.1.1 (必须的) 建表时必定要有主键,通常是个无关列

9.1.2 选择惟一性索引

9.1.3(必须的) 为常常须要where 、ORDER BY、GROUP BY,join on等操做的字段，

9.1.4 尽可能使用前缀来索引

9.1.5 限制索引的数目

9.1.6 删除再也不使用或者不多使用的索引(percona toolkit)

9.1.7 大表加索引,要在业务不繁忙期间操做

9.1.8 尽可能少在常常更新值的列上建索引

9.1.9 建索引原则

9.2 不走索引的状况（开发规范）

9.2.1 没有查询条件，或者查询条件没有创建索引

9.2.2 查询结果集是原表中的大部分数据，应该是25％以上。

9.2.3 索引自己失效，统计数据不真实

9.2.4 查询条件使用函数在索引列上，或者对索引列进行运算，运算包括(+，-，*，/，! 等)

9.2.5 隐式转换致使索引失效.这一点应当引发重视.也是开发中常常会犯的错误.

9.2.6 <> ，not in 不走索引（辅助索引）

9.2.7 like "%_" 百分号在最前面不走

3. B树基于不一样的查找算法分类介绍