Sql Server之旅——第四站 你必须知道的非汇集索引扫描

  

  非汇集索引,这个是你们都很是熟悉的一个东西,有时候咱们因为业务缘由,sql写的很是复杂,须要join不少张表,而后就泪流满面了。。。这时候就sql

有DBA或者资深的开发给你看这个猥琐的sql,经过执行计划一分析。。。或许就看出了不应有的表扫描。。。万恶之源。。。而后给你在关键的字段加上非函数

汇集索引后。。。才发现提速比阿斯顿马丁还要快。。。那么一个问题来了,为何非汇集索引能提速这么快。。。怎么作到的???是否是很是的好奇???spa

这篇咱们来解开神秘面纱。code

 

一:现象orm

      先让咱们一睹非汇集索引的真容,看看到底在执行计划看来是个什么玩意。。。我这里有个product表,里面灌了8w多数据,而后在Name列上创建blog

一个非汇集索引,就像下图同样:索引

  

从上图中看到了两个好玩的东西,一个就是我想看到的“索引查找[nonclustered]”,这个你们很熟悉,也是这篇要说的,而后咱们还看到了一个“RID查找”,ip

乍一看这是什么鸡巴玩意。。。非汇集索引跟它扯上什么关系了???开发

 

二:什么是RID博客

  经过前面几篇,我想你们都知道了数据页中的记录是如何寻找的?秘密就是经过slot槽位中的偏移量决定的,那问题来了,若是上升到数据页层面,我

只须要(pageID:slotID)就能够找到记录了,对不对?那若是我上升了文件层面,那是否是只须要知道(fileID:pageID:slotID)就能够找到数据页中的 

记录了?其实这里的RID就是站在文件的高度经过(fileID:pageID:slotID)找到表记录的。。。既RID=RowID=(fileID:pageID:slotID),若是你非要眼见

为实的话,在sq中l还真提供了这么个函数(sys.fn_PhysLocFormatter(%%physloc%%)),咱们看下图:

看了上面的图,是否是很兴奋,一目了然,好比productID=18088这条记录,然来是在1号文件,34941号数据页,0号槽位上,productID=18089

是在1号槽位上,好了,当你知道RID是个什么东西的时候,我想你已经离完全理解非汇集索引不远啦。。。

 

三:非汇集索引

  有一点咱们确定知道,就是非汇集索引是能够加速查找的,要是跟表扫描那样的龟速,那也就失去了索引的目的,既然能加速,是由于它和汇集索

引同样,在底层都玩起了B树,首先咱们插入一些样例数据。

 1 DROP TABLE dbo.Person
 2 
 3 CREATE TABLE Person(ID INT IDENTITY,NAME CHAR(900))
 4 CREATE  INDEX idx_Person_Name ON dbo.Person(Name)
 5 
 6 DECLARE @ch AS INT=97
 7 
 8 WHILE @ch<=122
 9 BEGIN
10     INSERT INTO dbo.Person VALUES(REPLICATE(CHAR(@ch),5))
11     SET @ch=@ch+1
12 END

上面的sql,我故意在Name列设置为900个char,这也是索引的上限值,这样的话,我DBCC就能够导出不少数据页和索引页了。

能够看到,当我dbcc ind 的时候,发现Person表中已经有4个数据页,5个索引页,其中151号数据页是表跟踪页,174号为索引跟踪页,这也就

说明当我创建索引后,引擎给咱们分配了专门的索引页来存放咱们创建的Name索引,那下一步就是咱们来看看这些索引中都存放着什么,这也是我

很是关心的,接下来我导出173号索引页。

1 DBCC PAGE(Ctrip,1,173,1)

 1 Slot 0, Offset 0x60, Length 912, DumpStyle BYTE
 2 
 3 Record Type = INDEX_RECORD           Record Attributes =  NULL_BITMAP     Record Size = 912
 4 
 5 Memory Dump @0x000000000EF1C060
 6 
 7 0000000000000000:   16616161 61612020 20202020 20202020 †.aaaaa           
 8 0000000000000010:   20202020 20202020 20202020 20202020 9 0000000000000020:   20202020 20202020 20202020 2020202010 0000000000000030:   20202020 20202020 20202020 2020202011 0000000000000040:   20202020 20202020 20202020 2020202012 0000000000000050:   20202020 20202020 20202020 2020202013 0000000000000060:   20202020 20202020 20202020 2020202014 0000000000000070:   20202020 20202020 20202020 2020202015 0000000000000080:   20202020 20202020 20202020 2020202016 0000000000000090:   20202020 20202020 20202020 2020202017 00000000000000A0:   20202020 20202020 20202020 2020202018 00000000000000B0:   20202020 20202020 20202020 2020202019 00000000000000C0:   20202020 20202020 20202020 2020202020 00000000000000D0:   20202020 20202020 20202020 2020202021 00000000000000E0:   20202020 20202020 20202020 2020202022 00000000000000F0:   20202020 20202020 20202020 2020202023 0000000000000100:   20202020 20202020 20202020 2020202024 0000000000000110:   20202020 20202020 20202020 2020202025 0000000000000120:   20202020 20202020 20202020 2020202026 0000000000000130:   20202020 20202020 20202020 2020202027 0000000000000140:   20202020 20202020 20202020 2020202028 0000000000000150:   20202020 20202020 20202020 2020202029 0000000000000160:   20202020 20202020 20202020 2020202030 0000000000000170:   20202020 20202020 20202020 2020202031 0000000000000180:   20202020 20202020 20202020 2020202032 0000000000000190:   20202020 20202020 20202020 2020202033 00000000000001A0:   20202020 20202020 20202020 2020202034 00000000000001B0:   20202020 20202020 20202020 2020202035 00000000000001C0:   20202020 20202020 20202020 2020202036 00000000000001D0:   20202020 20202020 20202020 2020202037 00000000000001E0:   20202020 20202020 20202020 2020202038 00000000000001F0:   20202020 20202020 20202020 2020202039 0000000000000200:   20202020 20202020 20202020 2020202040 0000000000000210:   20202020 20202020 20202020 2020202041 0000000000000220:   20202020 20202020 20202020 2020202042 0000000000000230:   20202020 20202020 20202020 2020202043 0000000000000240:   20202020 20202020 20202020 2020202044 0000000000000250:   20202020 20202020 20202020 2020202045 0000000000000260:   20202020 20202020 20202020 2020202046 0000000000000270:   20202020 20202020 20202020 2020202047 0000000000000280:   20202020 20202020 20202020 2020202048 0000000000000290:   20202020 20202020 20202020 2020202049 00000000000002A0:   20202020 20202020 20202020 2020202050 00000000000002B0:   20202020 20202020 20202020 2020202051 00000000000002C0:   20202020 20202020 20202020 2020202052 00000000000002D0:   20202020 20202020 20202020 2020202053 00000000000002E0:   20202020 20202020 20202020 2020202054 00000000000002F0:   20202020 20202020 20202020 2020202055 0000000000000300:   20202020 20202020 20202020 2020202056 0000000000000310:   20202020 20202020 20202020 2020202057 0000000000000320:   20202020 20202020 20202020 2020202058 0000000000000330:   20202020 20202020 20202020 2020202059 0000000000000340:   20202020 20202020 20202020 2020202060 0000000000000350:   20202020 20202020 20202020 2020202061 0000000000000360:   20202020 20202020 20202020 2020202062 0000000000000370:   20202020 20202020 20202020 2020202063 0000000000000380:   20202020 20940000 00010000 00020000 †     ........... 
1 Row - Offset                         
2 7 (0x7) - 6480 (0x1950)              
3 6 (0x6) - 5568 (0x15c0)              
4 5 (0x5) - 4656 (0x1230)              
5 4 (0x4) - 3744 (0xea0)               
6 3 (0x3) - 2832 (0xb10)               
7 2 (0x2) - 1920 (0x780)               
8 1 (0x1) - 1008 (0x3f0)               
9 0 (0x0) - 96 (0x60)     

 

从上面至少能够发现三个有趣的现象:

<1>:173号索引页中slot0和slot1槽位指向记录的内容已经有序了,好比:aaaaa,bbbbb。。。。这样。。。。原来非汇集索引也是有序呀。。。

<2>:6161616161就是16进制的aaaaa。

    9400000001000000 :这几个数字很是重要,由于是16进制表示,因此2位16进制表示一个字节,因此能够这么解释,前面4个字节表示

    pageID,中间2个字节表示fileID,后面2个字节表示slot,看到这里你是否是想起了RID。。。由于RID就是这三样的组合。。。原来非汇集索

   引的记录存放的就是“key+RowID”呀。。。。

<3>:经过最后的槽位列表,能够得知173号索引页上存放着8条索引记录。

 

  好了,看完了叶子节点,咱们再看分支节点,也就是IndexLevel=1的那条索引数据页,也就是78号。ok,dbcc看看吧。

当看到这个列表的时候,不知道你脑子里面是否是有一幅图出来了,就像上一篇看到汇集索引同样,由于它的结构和汇集索引很是像,只不过

非汇集索引这里多了一个RID而已。。。最后我也把图贡献一下。

 

总结一下:在走非汇集索引的时候,好比你的条件是where name='jjjjj' 时,它的逻辑是这样的,根据78号索引数据页的key的范围,而后经过

      rowid走到了79号索引数据页,而后在79号索引数据页中顺利的找到了jjjjj,这时候就能够拿出jjjjj的rowid去表数据页中直接定位记录,

      最后输出。。。。。这个也就是博客开头的地方为何会出现RID的查找。。。

相关文章
相关标签/搜索