mysql优化实战（explain&&索引）

时间 2019-11-07

原文原文链接

实验环境：mysql

一、sql工具：Navicat 二、sql数据库，使用openstack数据库做为示例

1、mysql索引查询sql

show index from instances

结果字段解释： vcmRlcj0="1" cellpadding="2" cellspacing="0">数据库

Table：数据库表名 Non_unique：索引不能包括重复词，则为0。能够，则为1。 Key_name：索引的名称。
索引中的列序列号，从1开始。列名称列以什么方式存储在索引中。在MySQL中，有值‘A’（升序）或NULL（无分类）。索引中惟一值的数目的估计值。经过运行ANALYZE TABLE或myisamchk -a能够更新。基数根据被存储为整数的统计数据来计数，因此即便对于小型表，该值也没有必要是精确的。基数越大，当进行联合时，MySQL使用该索引的机会就越大。若是列只是被部分地编入索引，则为被编入索引的字符的数目。若是整列被编入索引，则为NULL。指示关键字如何被压缩。若是没有被压缩，则为NULL。若是列含有NULL，则为YES。若是没有，则该列为NO。用过的索引方法（BTREE, FULLTEXT, HASH, RTREE）。 Comment：注释。

2、验证Mysql的主键会自动建立索引？建立一个没有主键的ttx_index数据库表：查询索引：结果显示没有索引。
改变ttx_index数据库表字段id，将之设为主键，再次查询索引：
得出结论，在Mysql中，数据库主键会自动创建索引。

3、Mysql性能优化利器：explain 一、首先查看instances数据库表的索引：
二、EXPLAIN 用法详解：性能优化

EXPLAIN SELECT * FROM instances

根据上述结果，能够此查询花了0.027ms，没有可用的索引。

explain字段详解：工具

table：显示这一行的数据是关于哪张表的性能

type：这是重要的列，显示链接使用了何种类型。从最好到最差的链接类型为const、eq_reg、ref、range、indexhe和ALLmysql索引

possible_keys：显示可能应用在这张表中的索引。若是为空，没有可能的索引。能够为相关的域从WHERE语句中选择一个合适的语句优化

key：实际使用的索引。若是为NULL，则没有使用索引。不多的状况下，MYSQL会选择优化不足的索引。这种状况下，能够在SELECT语句中使用USE INDEX（indexname）来强制使用一个索引或者用IGNORE INDEX（indexname）来强制MYSQL忽略索引spa

key_len：使用的索引的长度。在不损失精确性的状况下，长度越短越好指针

ref：显示索引的哪一列被使用了，若是可能的话，是一个常数

rows：MYSQL认为必须检查的用来返回请求数据的行数

Extra：关于MYSQL如何解析查询的额外信息。将在下表中讨论，但这里能够看到的坏的例子是Using temporary和Using filesort，意思MYSQL根本不能使用索引，结果是检索会很慢

extra列返回的描述的意义：

Distinct:一旦MYSQL找到了与行相联合匹配的行，就再也不搜索了

Not exists: MYSQL优化了LEFT JOIN，一旦它找到了匹配LEFT JOIN标准的行，就再也不搜索了

Range checked for each Record（index map:#）:没有找到理想的索引，所以对于从前面表中来的每个行组合，MYSQL检查使用哪一个索引，并用它来从表中返回行。这是使用索引的最慢的链接之一

Using filesort: 看到这个的时候，查询就须要优化了。MYSQL须要进行额外的步骤来发现如何对返回的行排序。它根据链接类型以及存储排序键值和匹配条件的所有行的行指针来排序所有行

Using index: 列数据是从仅仅使用了索引中的信息而没有读取实际的行动的表返回的，这发生在对表的所有的请求列都是同一个索引的部分的时候

Using temporary 看到这个的时候，查询须要优化了。这里，MYSQL须要建立一个临时表来存储结果，这一般发生在对不一样的列集进行ORDER BY上，而不是GROUP BY上

Where used 使用了WHERE从句来限制哪些行将与下一张表匹配或者是返回给用户。若是不想返回表中的所有行，而且链接类型ALL或index，这就会发生，或者是查询有问题不一样链接类型的解释（按照效率高低的顺序排序）

system 表只有一行：system表。这是const链接类型的特殊状况

const:表中的一个记录的最大值可以匹配这个查询（索引能够是主键或唯一索引）。由于只有一行，这个值实际就是常数，由于MYSQL先读这个值而后把它当作常数来对待

eq_ref:在链接中，MYSQL在查询时，从前面的表中，对每个记录的联合都从表中读取一个记录，它在查询使用了索引为主键或唯一键的所有时使用

ref:这个链接类型只有在查询使用了不是唯一或主键的键或者是这些类型的部分（好比，利用最左边前缀）时发生。对于以前的表的每个行联合，所有记录都将从表中读出。这个类型严重依赖于根据索引匹配的记录多少—越少越好

range:这个链接类型使用索引返回一个范围中的行，好比使用>或<查找东西时发生的状况

index: 这个链接类型对前面的表中的每个记录联合进行彻底扫描（比ALL更好，由于索引通常小于表数据）

ALL:这个链接类型对于前面的每个记录联合进行彻底扫描，这通常比较糟糕，应该尽可能避免

那么如何才能让sql走索引查询呢？

EXPLAIN SELECT * FROM instances WHERE id=1

从上图能够，该sql语句走了索引。由于该表中id为主键，mysql会自动建立索引，所以当将id做为where条件查询时，数据库会自动走索引。
接下来实验，当不走索引仍是查询id=1这条数据时候，会是如何？

SELECT id, display_name FROM instances WHERE id=1

EXPLAIN SELECT * FROM instances WHERE display_name = "vm1"

结论：在查询时候，若是where条件中的字段有索引（走不走索引，取决于where条件中的字段），在执行sql语句时，mysql会自动走索引。
可是有个问题是，在走不走索引，查询花费时间都是0.001ms，彷佛没有获得性能提升？

SELECT COUNT(*) FROM instances

在数据库表中instance数据总条数才74条，所以索引无法发挥它的性能优点，接下来人为制造上w条数据：

insert instances(display_name) select display_name from instances

注：上述语句，可用来为数据库表指数形式插入新数据。
再次查询总条数：

SELECT COUNT(*) FROM instances

此次数据已经有接近500w了。再次验证上述索引性能问题：
一、为了对比的真实性,将id=1的数据记录的display_name修改成惟一名字test_index_dispaly_name

SELECT id, display_name FROM instances WHERE id=1

二、不走索引查询：

SELECT * FROM instances WHERE display_name = 'test_index_dispaly_name'

三、经过id走索引查询：

SELECT * FROM instances WHERE id=1

结论：对于百万上亿级数据，走不走索引效率影响至关明显（效率差异都到万了）。

四、哪些状况sql不会走索引？

时间关系，此处暂且未总结，后续有时间补上。如有须要请自行网上查找。