SQL Server 非汇集索引的覆盖,链接,交叉和过滤 <第二篇>

  在SQL Server中,非汇集索引其实能够看作是一个含有汇集索引的表,但相对实际的表来讲,非汇集索引中所存储的表的列数要少得多,通常就是索引列,汇集键(或RID)。非汇集索引仅仅包含源表中的非汇集索引的列和指向实际物理表的指针。算法

1、非汇集索引之INCLUDE

  非汇集索引其实能够看作一个含有汇集索引的列表,当这个非汇集索引中包含了查询所须要的全部信息的时候,则就再也不须要去查基本表,仅仅作非汇集索引就可以获得所须要的数据。INCLUDE实际上也能称为覆盖索引,但它不影响索引键的大小。数据库

  先来看下面一张表:性能

  

  此表大约是15万数据左右。汇集索引列是Id,咱们先来在Name列创建一个非汇集索引。优化

  CREATE NONCLUSTERED 
  INDEX Index_Name ON Person(Name)

  而后执行查询:spa

  SELECT Name,Age FROM Person where Name = '欧琳琳'

  执行计划以下:指针

  

  上面的执行过程是,先扫描非汇集索引列,找到汇集索引,而后在经过汇集索引定位到数据。code

  下面咱们删除掉刚才那个索引,再建过另一个。blog

  DROP INDEX Person.Index_Name    --删除非汇集索引Index_Name

  CREATE NONCLUSTERED             --再从新建过一次,此次咱们INCLUDE Age列
  INDEX Index_Name ON Person(Name)
  INCLUDE (Age)

  如今咱们再来看看刚才的查询的执行计划:索引

  

  因为Age列也被INCLUDE进了非汇集索引INDEX_Name中,所以此次仅仅经过查找非汇集索引就可以获得所需的所有数据。不须要再扫描汇集索引了。明显此次查询要比刚才快。开发

  要注意的是INCLUDE进来的列,并不做为索引使用,能当索引扫描的,只是索引列

  INCLUDE最好在如下状况中使用:

  • 你不但愿增长索引键的大小,可是仍然但愿有一个覆盖索引;
  • 你打算索引一种不能被索引的数据类型(除了文本、ntext和图像);
  • 你已经超过了一个索引的关键字列的最大数量(可是最好避免这个问题);

2、非汇集索引之覆盖

   索引覆盖指的是:创建的索引使得-SQL查询不用到达基本表仅仅经过索引查找就获得了所需数据。  

  若是查询遇到一个索引而且彻底不须要引用数据表就获得了所需数据,那么这个索引就能够称为覆盖索引。覆盖索引对于减小查询的逻辑读是一种有用的技术。

  下面删除以前建立的索引,在来看看索引的覆盖。

  CREATE NONCLUSTERED INDEX INDEX_NAME ON Person(Name,Age)

  SELECT Name,Age FROM Person WHERE Name = '欧琳琳'

  看看执行计划:

   

   能够看到,也是仅仅查找了非汇集索引就获得告终果。效率很是快。

  下面来看看覆盖和前面的INCLUDE有什么区别呢?咱们将搜索条件改成Age。

   覆盖索引:

  

  INCLUDE:

  

  留意一下,INCLUDE是汇集表扫描了,而覆盖索引依然使用非汇集索引就找到告终果。

  所以能够得出结论,INCLUDE列并不能当索引键使用。

  为了利用覆盖索引,要注意SELECT语句的清单,应尽量使用较少的列来保持小的覆盖索引的尺寸,使用INCLUDE语句来添加的列这时候才有意义。

  在创建许多覆盖索引以前,考虑SQL Server如何有效和自动地使用索引交叉来为查询即时建立覆盖索引。

3、非汇集索引的交叉

  若是一个表有多个索引,那么SQL Server可使用多个索引来执行一个查询。SQL Server能够利用多个索引,根据每一个索引选择小的数据子集,而后执行两个子集的一个交叉(即只返回知足全部条件的那些行)。SQL Server能够在一个表上开发多个索引,而后使用一个算法来在两个子集中获得交叉(能够理解为求交集)。

  咱们先删除掉前面创建的索引,再来新建过:

  

  非汇集索引的本质是表,经过额外创建表使得几个非汇集索引之间进行像表同样的Join,从而使非汇集索引之间能够进行Join来在不访问基本表的状况下给查询优化器提供所须要的数据。

  为了增进一个查询的性能,SQL Server能够在表上使用多个索引。所以,考虑建立多个窄索引来代替宽的索引键。SQL Server可以在须要的时候一块儿使用它们,当不须要时,查询能够从窄索引中获益。在建立一个覆盖索引时,须要肯定索引的宽度是否能够接受,使用包含列是否能够完成任务。若是不行则肯定现有的包含大部分覆盖索引所须要的列的非汇集索引。若是有可能,适当从新安排现有非汇集索引的列顺序,使优化器可以考虑两个非汇集索引之间的的一个索引交叉。

  有时候,可能必须为一下缘由建立一个单独的非汇集索引:

  •   从新排列现有索引中的列不被容许;
  •   覆盖索引所须要的一些列不能被包含在现有的非汇集索引中;
  •   两个现有非汇集索引中的总列数可能多于覆盖索引所须要的列数;

  在这些状况下,能够在剩下的列上建立非汇集索引。若是新索引符合和现有索引符合覆盖索引的要求,优化器将可以使用索引交叉。在为新肯定列及其顺序时,也要注意其余查询,以尝试使其最大化。

4、非汇集索引的链接

  索引链接是索引交叉的特例,它将覆盖索引技术应用到索引交叉。若是没有单个覆盖查询的索引而存在多个索引一块儿能够覆盖该查询,SQL Server可使用索引链接来彻底知足查询而不须要转到基本表。

  非汇集索引的链接其实是非汇集索引的交叉的一种特例。使得多个非汇集索引交叉后能够覆盖所要查询的数据,从而使得从减小查询基本表变成了彻底不用查询基本表。

  --创建两个非汇集索引,一个在Name列,一个在INSiteId列
  CREATE NONCLUSTERED INDEX INDEX_Name ON Person(Name) INCLUDE(Age)  --索引仍是刚才的索引,可是包含多一列
  CREATE NONCLUSTERED INDEX INDEX_INSiteId ON Person(INSiteId) INCLUDE(Height)  --同上   SELECT Name,Age,Height,INSiteId FROM Person WHERE INSiteId > 5155400 AND Name = '简单'   --注意条件,索引链接恰好能覆盖所需数据,从而避免查找基本表

  查看结果:

  

  索引交叉和索引链接有什么区别呢?前面说到果,索引链接是索引交叉的特例。索引链接在交叉了以后,不用再转到基本表,少了一步书签查找。而索引交叉以后,还有一步书签查找转到基本表得到数据,由于索引交叉的返回列并不能彻底符合SELECT的列。

5、非汇集索引的过滤

  过滤索引是使用过滤器的非汇集索引,这个过滤器基本上是一个WHERE子句,用来在可能没有很好选择性的一个或多个列上建立一个高选择性的关键字组。

  例如,一个具备大量NULL值的列可能被存储为稀疏列来下降这些null值的开销。在这个列添加一个过滤索引将使你拥有在不是null的数据上的索引。

  在下面的所使用的Person表中,Name列有超过50%是NULL值,执行查询:

  SELECT Name,Age FROM Person WHERE Name IS NOT NULL

  

  这是一个汇集表扫描,并无有效地使用索引。

  当咱们创建非汇集索引,且加上过滤后:INCLUDE()是为了造成覆盖索引。

  CREATE NONCLUSTERED INDEX INDEX_Name ON Person(Name) INCLUDE(Age) WHERE Name IS NOT NULL  --过滤的索引上过滤掉NULL值的行

  

   在个人数据库当中,创建索引,加不加过滤没太大区别(由于很遗憾,Name列基本上没有NULL的),可是当过滤条件IS NOT NULL可以过滤不少条数据的时候,这时过滤的做用才可以展现出来若是过滤条件,可以筛选掉不少条数据,那么性能无疑会大有提高。

  过滤索引再许多方面带来回报:

  •   减小索引尺寸从而增进查询效率;
  •   创建更小的索引下降存储开销;
  •   由于尺寸减少,下降了索引维护的成本;
相关文章
相关标签/搜索