你的sql查询为何这么慢？

时间 2019-11-07

标签 sql 查询为何栏目 SQL 繁體版

原文原文链接

作后台开发的程序猿一般须要写各类各样的sql，可不少时候写出来的sql虽然能知足功能性需求，性能上却不尽人意。若是业务复杂，表结构和索引设计又不合理的话，写出来的sql执行时间可能会达到几十甚至上百秒，对于生产环境来讲，这是至关恐怖的一件事。所以，了解一些常见的mysql优化技巧颇有必要。本文将从表结构和索引设计，sql执行原理，sql编写优化3方面进行分析和讲解，但愿能对你们有所帮助。mysql

一、表结构，字段设计是否合理？sql

这是最基础也是最容易忽视的一个环节。良好的表结构设计是sql优化的基础，在这个存储廉价，空间足够的时代，设计表的过程当中，不必定要彻底知足范式理论，咱们能够经过适当的冗余设计，避免连表查询，达到以空间来换取时间的目的。设计表的时候，咱们会根据业务需求来决定建几个表，表之间经过哪些外键来关联。并且一般须要考虑到数据规模（单表记录数最好不要超过千万，若是超过可能须要分表分区，包括垂直分表和水平分表）、查询更新频率（哪些字段常常用于查询，哪些常常用于更新），各字段的类型和长度取值，在哪些字段上建哪一种类型的索引等等。数据库

比方说，若是你是innodb存储引擎，那么你的主键最好设计成自增的，这样效率最高。由于innodb存储引擎的索引是基于B+树实现，若是采用自增设计，就能快速找到插入节点的位置进行插入或删除，对其余节点影响较小，避免频繁分裂树结构。有的公司设计表的时候喜欢采用UUID的方式来做为主键，这样的好处是数据迁移的时候，主键不会变，能找到对应关系，可是会有2个问题：一、UUID的长度是36位，占用字节较长，尤为对于innoDB来讲，创建辅助索引的时候，辅助索引里存储的都是主键的值，这会致使辅助索引占据空间变大。二、UUID是无序的，每次插入或者删除一条记录的时候，为了维持索引的特性，可能会致使节点频繁分裂，这样很是影响效率。网络

在设计字段的时候，尽可能采用整形的，好比用tinyint 代替char(1)，这样便于存储和计算。在知足业务的前提下，长度越短越好，若是有大对象，好比text或blob类型的字段，而且这些字段查询频率较低时，能够考虑拆表来单独存储（也就是垂直分表），避免对主表形成影响。此外，设计表的时候，最好设计为not null，由于容许为null时，mysql还须要有个字节来标识是不是null，并且mysql索引没法存储null，若是在一列容许null 的索引中使用where colum is null，那么mysql是不会走索引的。那若是有的字段就是没值怎么办？能够用空字符串或者0这些代替。mysql优化

二、sql执行原理性能

写好了sql后，sql是怎么执行的呢？当咱们运行sql的时候，会经历客户端发送请求，服务端接受请求并解析sql，生成sql执行计划，执行并将结果返回给客户端这些过程。要优化sql，首先要知道sql到底在哪些环节花了多长时间。这里不去分析网络因素对sql形成的影响，咱们只需关注sql生成的执行计划，这个执行计划能很大程度上帮助咱们找到优化sql的方向。那怎么看sql的执行计划呢？explain 你的sql。好比在mysql 5.6自带的sakila数据库上执行以下sql：mysql索引

能够看到有id，select_type，partitions，type，possible_keys等等内容。首先说一下，比较重要的有id，select_type，type（至关重要），key（至关重要），key_len（可能重要），extra（至关重要）这几列。其余的列就不介绍了。这些内容都表明什么意义呢？优化

id一般表示执行顺序，好比有3行，id分别为1，1，2，那么执行顺序就是1，1，2，一般id的个数对应select的个数。编码

select_type表示查询类型，主要有如下几种：spa

SIMPLE：简单SELECT(不使用UNION或子查询等)

PRIMARY：最外面的SELECT

UNION：UNION中的第二个或后面的SELECT语句

DEPENDENT UNION：UNION中的第二个或后面的SELECT语句，取决于外面的查询

UNION RESULT：UNION的结果。

SUBQUERY：子查询中的第一个SELECT

DEPENDENT SUBQUERY：子查询中的第一个SELECT，取决于外面的查询

DERIVED：导出表的SELECT(FROM子句的子查询)

type：表示使用了哪一种类别的链接,有无使用索引，是使用Explain命令分析性能瓶颈的关键项之一，性能由好到坏依次为：system > const > eq_ref > ref > fulltext > ref_or_null > index_merge > unique_subquery > index_subquery > range > index > ALL。通常来讲，得保证查询至少达到range级别，最好能达到ref，不然就可能会出现性能问题。

key：表示使用的索引，若是没有选择索引，则为NULL。

key_len：表示索引长度，对于单列索引，该值意义不大，对于联合索引，则有重要做用，key_len的大小显示了联合索引中真正用到的哪几列，若是是联合索引，则该值越大表示走的索引列越多，查询效率越高，这里涉及到索引前缀的知识，该部分后面有空再讲。对于该列的值，也有计算公式：若是是单列索引，则key_len=索引列的长度*字符编码占用的字节数（UTF8编码为3字节，GBK为2字节，latin为1字节）+标识是否容许null的字节数（1字节）+内容长度（针对可变长列，1字节），举个例子：

该表中，city_id是主键，city字段是varchar类型，长度为50，默认为null，执行explain select city from sakila.city，以下：

能够发现，这里走了覆盖索引，顺便提下，覆盖索引就是sql的查询内容经过走sql索引就能查到，这种状况就是覆盖索引，因此这里咱们看到，即便咱们不加where条件也能走索引。索引列是city_name，key_len为152，怎么来的呢？对照上面的公式：50长度*3（UTF8编码一个字符3个字节）+1（标识是否为null）+1（标识内容的长度），这样是否是很清晰了？

最后这列Extra：包含MySQL解决查询的详细信息，也是关键参考项之一。当这列出现了Using filesort（出现这种状况九死一辈子，颇有必要优化）和Using temporary（这里就是十死0生了，必须优化！）就须要格外注意了。

三、优化你的sql

当完成了上面2步之后，若是发现你的sql很慢，这时候就必须对咱们的sql进行优化了。2个大的思路是先问问本身：是否建了索引？索引建的是否合适？当咱们分析一条sql慢的时候，咱们须要考虑，这条sql查询的内容是否建了索引呢？若是没有，那要在哪列建哪一种索引呢？好比咱们要从用户表（>100W条记录）中根据姓名查某个用户，若是没有建索引，显然会很慢，那么怎么建索引呢？你可能会说很简单嘛，就在姓名上建个索引不就完了嘛。那假如（只是假如）姓名这列里，100W个用户中，有50W个叫张三的，20W个叫李四的，30W个王五的，你在这里建合适吗？显然不合适，或者说，仅仅对这列建单列索引不合适，由于选择性太差。并且这会致使个问题，当sql存储引擎发现走全表扫描比走索引更快的时候，它会放弃走索引，直接扫表。这里有个最重要的关键词：选择性，选择性能够理解为：该表中该列的不重复数/总记录数，该比值在0-1之间，越接近1说明选择性越好，惟一索引的选择性就是1，所以惟一索引是性能最好的索引。像上面用户表中，该表的选择性咱们能够这么查：select count(distinct name)/count(*) from customer；所以咱们要作的，就是想办法提升索引的选择性，能够采用建联合索引，或者部分索引（就是取该列的N个字符来建索引，可是这种索引不能用于group by中）等等，遵循这个思路，咱们就明白，有的开发员在性别列建索引，其实并非一个好选择，由于选择性太差。要建高效的索引，就必定是选择性好的索引。

端午假期第一天，上午看了会世界杯，下午闲的无聊写了这篇博客，欢迎拍砖交流，转载请务必注明出处，谢谢。