探索MSSQL执行计划

时间 2020-01-13

原文原文链接

最近总想整理下对MSSQL的一些理解与感悟，却一直没有心思和时间写，晚上无事便写了一篇探索MSSQL执行计划,本文讲执行计划但不只限于讲执行计划。程序员

网上的SQL优化的文章实在是不少，说实在的，我也曾经处处找这样的文章，什么不要使用IN了，什么OR了，什么AND了，不少不少，还有不少人拿出仅几S甚至几MS的时间差的例子来证实着什么(有点好笑)，让许多人不知道其是对仍是错。而SQL优化又是每一个要与数据库打交道的程序员的必修课，因此写了此文，与朋友们共勉。数据库

谈到优化就必然要涉及索引，就像要讲锁必然要说事务同样，因此你须要了解一下索引，仅仅是索引，就能讲半天了，因此索引我就不说了(打不少字是很累的，何况我也知之甚少)，能够去参考相关的文章，这个网上资料比较多了。缓存

今天来探索下MSSQL的执行计划，来让你们知道如何查看MSSQL的优化机制，以此来优化SQL查询。并发

--DROP TABLE T_UserInfo---------------------------------------------------- ide

--建测试表函数

CREATE TABLE T_UserInfo 测试

( 优化

Userid varchar(20), UserName varchar(20), orm

RegTime datetime, Tel varchar(20), 索引

)

--插入测试数据

DECLARE @I INT

DECLARE @ENDID INT

SELECT @I = 1

SELECT @ENDID = 100 --在此处更改要插入的数据，从新插入以前要删掉全部数据

WHILE @I <= @ENDID

BEGIN

INSERT INTO T_UserInfo

SELECT 'ABCDE'+CAST(@I AS VARCHAR(20))+'EF','李'+CAST(@I AS VARCHAR(20)),

GETDATE(),'876543'+CAST(@I AS VARCHAR(20))

SELECT @I = @I + 1

END

--相关SQL语句解释

---------------------------------------------------------------------------

--建汇集索引

CREATE CLUSTERED INDEX INDEX_Userid ON T_UserInfo (Userid)

--建非汇集索引

CREATE NONCLUSTERED INDEX INDEX_Userid ON T_UserInfo (Userid)

--删除索引

DROP INDEX T_UserInfo.INDEX_Userid

---------------------------------------------------------------------------

--显示有关由Transact-SQL 语句生成的磁盘活动量的信息

SET STATISTICS IO ON

--关闭有关由Transact-SQL 语句生成的磁盘活动量的信息

SET STATISTICS IO OFF

--显示[返回有关语句执行状况的详细信息，并估计语句对资源的需求]

SET SHOWPLAN_ALL ON

--关闭[返回有关语句执行状况的详细信息，并估计语句对资源的需求]

SET SHOWPLAN_ALL OFF

---------------------------------------------------------------------------

请记住：SET STATISTICS IO 和 SET SHOWPLAN_ALL 是互斥的。

OK，如今开始：

首先，咱们插入100条数据

而后我写了一个查询语句：

SELECT * FROM T_UserInfo WHERE USERID='ABCDE6EF'

选中以上语句，按Ctrl+L，以下图

这就是MSSQL的执行计划：表扫描：扫描表中的行

而后咱们来看该语句对IO的读写：

执行:SET STATISTICS IO ON

此时再执行该SQL:SELECT * FROM T_UserInfo WHERE USERID='ABCDE6EF'

切换到消失栏显示以下：

表'T_UserInfo'。扫描计数1，逻辑读1 次，物理读0 次，预读0 次。

解释下其意思：

四个值分别为：

执行的扫描次数;

从数据缓存读取的页数;

从磁盘读取的页数;

为进行查询而放入缓存的页数

重要：若是对于一个SQL查询有多种写法，那么这四个值中的逻辑读(logical reads)决定了哪一个是最优化的。

接下来咱们为其建一个汇集索引

执行CREATE CLUSTERED INDEX INDEX_Userid ON T_UserInfo (Userid)

而后再执行SELECT * FROM T_UserInfo WHERE USERID='ABCDE6EF'

切换到消息栏以下显示：

表'T_UserInfo'。扫描计数1，逻辑读2 次，物理读0 次，预读0 次。

此时逻辑读由原来的1变成2，

说明咱们又加了一个索引页，如今咱们查询时，逻辑读就是要读两页(1索引页+1数据页)，此时的效率还不如不建索引。

此时再选中查询语句，而后再Ctrl+L，以下图:

汇集索引查找：扫描汇集索引中特定范围的行

说明，此时用了索引。

OK,到这里你应该已经知道初步知道MSSQL查询计划和如何查看对IO的读取消耗了吧！

接下来咱们继续：

如今我再把测试数据改变成1000条

再执行SET STATISTICS IO ON,再执行

SELECT * FROM T_UserInfo WHERE USERID='ABCDE6EF'

在不加汇集索引的状况下：

表'T_UserInfo'。扫描计数1，逻辑读7 次，物理读0 次，预读0 次。

在加汇集索引的状况下：CREATE CLUSTERED INDEX INDEX_Userid ON T_UserInfo (Userid)

表'T_UserInfo'。扫描计数1，逻辑读2 次，物理读0 次，预读0 次。

(其实也就是说此时是读了一个索引页，一个数据页)

如此，在数据量稍大时，索引的查询优点就显示出来了。

先小总结下：

当你构建SQL语句时，按Ctrl+L就能够看到语句是如何执行，是用索引扫描仍是表扫描？

经过SET STATISTICS IO ON 来查看逻辑读，完成同一功能的不一样SQL语句，逻辑读

越小查询速度越快(固然不要找那个只有几百条记录的例子来反我)。

咱们再继续深刻：

OK，如今咱们再来看一次，咱们换个SQL语句，来看下MSSQL如何来执行的此SQL呢？

如今去掉索引：DROP INDEX T_UserInfo.INDEX_Userid

如今打开[显示语句执行状况的详细信息]：SET SHOWPLAN_ALL ON

而后再执行：SELECT * FROM T_UserInfo WHERE USERID LIKE 'ABCDE8%'

看结果栏：结果中有些具体参数，好比IO的消耗，CPU的消耗。

在这里咱们只看StmtText:

SELECT * FROM T_UserInfo WHERE USERID LIKE 'ABCDE8%'

|--Table Scan(OBJECT:([student].[dbo].[T_UserInfo]), WHERE:(like([T_UserInfo].[Userid], 'ABCDE8%', NULL)))

Ctrl+L看下此时的图行执行计划：

我再加上索引：

先关闭：SET SHOWPLAN_ALL OFF

再执行：CREATE CLUSTERED INDEX INDEX_Userid ON T_UserInfo (Userid)

再开启：SET SHOWPLAN_ALL ON

再执行：SELECT * FROM T_UserInfo WHERE USERID LIKE 'ABCDE8%'

查看StmtText:

SELECT * FROM T_UserInfo WHERE USERID LIKE 'ABCDE8%'

|--Clustered Index Seek(OBJECT:([student].[dbo].[T_UserInfo].[INDEX_Userid]), SEEK:([T_UserInfo].[Userid] >= 'ABCDE8' AND [T_UserInfo].[Userid] < 'ABCDE9'), WHERE:(like([T_UserInfo].[Userid], 'ABCDE8%', NULL)) ORDERED FORWARD)Ctrl+L看下此时的图行执行计划：

Ctrl+L看下此时的图行执行计划：

在有索引的状况下，咱们再写一个SQL：

SET SHOWPLAN_ALL ON

SELECT * FROM T_UserInfo WHERE LEFT(USERID,4)='ABCDE8%'

查看StmtText:

SELECT * FROM T_UserInfo WHERE LEFT(USERID,4)='ABCDE8%'

|--Clustered Index Scan(OBJECT:([student].[dbo].[T_UserInfo].[INDEX_Userid]), WHERE:(substring([T_UserInfo].[Userid], 1, 4)='ABCDE8%'))

Ctrl+L看下此时的图行执行计划：

咱们再分别看一下三种状况下对IO的操做

分别以下：

第一种状况：表'T_UserInfo'。扫描计数1，逻辑读7 次，物理读0 次，预读0 次。

第二种状况：表'T_UserInfo'。扫描计数1，逻辑读3 次，物理读0 次，预读0 次。

第三种状况：表'T_UserInfo'。扫描计数1，逻辑读8 次，物理读0 次，预读0 次。

这说明:

第一次是表扫描，扫了7页，也就是全表扫描

第二次是索引扫描，扫了1页索引，2页数据页

第三次是索引扫描+表扫描，扫了1页索引，7页数据页

[图形界面也有对CPU和IO的消耗，也能够看出来哪一个最优!]

经过比较，嘿嘿，很容易的看出：第二种第三种写法在都有索引的状况下，like有效的使用索引，而left则不能，这样一个最简单的优化的例子就出来了，哈哈。

若是以上你都明白了，那么你可能已经对SQL的优化有初步新的想法了，网上一堆堆的SQL优化的文章真的是那样吗？你本身试试就知道了，而没必要盲目去记那些东西，本身试试，看看MSSQL究竟是怎么来执行就明白了。

在我举的例子中，用的是汇集索引扫描，字段是字母加数字，你们能够试试看纯数字的、字母的、汉字的等等，了解下MMSQL会如何改变SQL语句来利用索引。而后再试试非汇集索引是什么状况？用不用索引和什么有关？子查询MSSQL是如何执行？IN用不用索引，LIKE用不用索引？函数用不用索引？OR、AND、UNION？子查询呢？在这里我不一一去试给你们看了，只要知道了如何去看MSSQL的执行计划（图形和文本)，不少事情就很明朗了。

大总结：

实现同一查询功能的SQL写法可能会有多种，若是判断哪一种最优化，若是仅仅是从时间上来测，会受不少外界因素的影响，而咱们明白了MSSQL如何去执行，经过IO逻辑读、经过查看图示的查询计划、经过其优化后而执行的SQL语句，才是优化SQL的真正途径。

另外提醒下：数据量的多少有时会影响MSSQL对同一种查询写法语句的执行计划，这一点在非汇集索引上特别明显，还有就是在多CPU与单CPU下，在多用户并发状况下，同一写法的查询语句执行计划会有所不一样，这个就须要你们有机会去试验了(我也没有这方面的太多经验与你们分享)。

先写这些吧，因为我对MSSQL认识还很浅薄，若有不对的地方，还请指正。