SQL Server索引内部结构：SQL Server索引的阶梯级别10

时间 2019-11-12

原文原文链接

本文是“Stairway系列：SQL Server索引的阶梯”的一部分索引是数据库设计的基础，并告诉开发人员使用数据库关于设计者的意图。不幸的是，当性能问题出现时，索引每每被添加为过后考虑。这里最后是一个简单的系列文章，应该使他们快速地使任何数据库专业人员“快速” 在以前的水平上，咱们采起了合理的方法来指标，重点是他们能为咱们作些什么。如今是时候采起物理方法，检查指标的内部结构;了解索引的内部特性致使了对索引开销的理解。只有经过了解指数结构，以及如何维持指数结构，才能了解和最大限度地减小指数创造，变更和消除的成本;和行插入，更新和删除。所以，从这个层面开始，咱们把重点放在包括指标成本和指标收益上。毕竟，最小化成本是最大化收益的一部分。并最大化您的指标的好处是这个阶梯是所有。 叶和非叶水平 任何指标的结构都由叶片和非叶片组成。尽管咱们历来没有明确表示过，但之前的全部级别都集中在索引的叶级上。所以，汇集索引的叶级是表自己;每一个叶级别条目是该表的一行。对于非汇集索引，每一个行中包含一个条目的叶级别（除了已过滤的索引）;每一个条目由索引键列，可选的包含列和书签组成，这是汇集索引键列或RID（行ID）值。索引条目也被称为索引行;不管是表行（聚簇索引叶级别条目），是指表行（非聚簇索引叶级别）仍是指向较低级别（非叶级别）的页面。非叶级别是在叶级上构建的结构，它使SQL Server可以： •维护索引键序列中的索引条目。 •根据索引键值快速找到叶级别的行。在1级中，咱们使用电话簿做为比喻来帮助解释索引的好处。咱们正在寻找“Meyer，Helen”的电话簿用户知道，入口将接近任何已排序的姓氏列表的中间，并直接跳到白页的中间以开始搜索。可是，SQL Server没有英文姓氏或其余数据的内在知识。也不会知道哪一个页面是“中间”页面，除非它从头至尾遍历整个索引。因此SQL Server在索引中创建了一些额外的结构。 非叶级别 这个额外的结构称为索引的非叶级别或节点级别;并被认为是创建在叶级的顶部，而无论其页面的物理位置在哪里。它的目的是为SQL Server提供每一个索引的单个页面入口点，以及从该页面到包含任何给定搜索关键字值的页面的简短遍历。索引中的每一个页面（不管其级别）都包含索引行或条目。在叶级页面中，正如咱们一再看到的，每一个条目都指向一个表行或者是表行。因此若是表中包含10亿行，索引的叶级将包含10亿条目。在叶级以上的级别，即最低的非叶级;每一个入口指向一个叶级页面。若是咱们的10亿条目索引平均每页有100个条目，这对于其搜索关键字由几个数字，日期和代码列组成的索引是一个现实的数字;那么叶级将包含1,000,000,000 / 100 = 10,000,000个页面。反过来，最低的非叶级将包含10,000,000个条目，每一个条目指向叶级页面，而且将跨越100,000个页面。每一个较高的非叶级别的页面的条目均指向下一级的页面。所以，咱们下一个较高的非叶级将包含100,000个条目，而且大小为1,000页。以上级别将包含1,000个条目，而且大小为10页;上面那个只包含十个条目的条目就只有一个页面;这就是中止的地方。位于索引顶部的独立页面称为根页面。位于根页面之下和叶级之上的索引的级别被称为中间级别。级别的编号从零开始，从叶级向上工做。所以，最低的中间级别老是等级1。非叶级别条目仅包含索引键列和指向较低级别页面的指针。包含的列仅存在于叶级别条目中; 它们不在非叶级别条目中进行。除了根页面以外，索引中的每一个页面都包含两个额外的指针。这些指针在索引序列中指向下一页和前一页，处于同一级别。生成的双向页面链使SQL Server可以以升序或降序扫描任何级别的页面。 一个简单的例子 下面的图1所示的简单图帮助说明了这种树状结构的索引。此图表示使用如下SQL在理论Personnel.Employee表的LastName / FirstName列上建立的索引：数据库

CREATE NONCLUSTERED INDEX IX_Full_Name数据库设计

ON Personnel.Employeeide

(函数

LastName,性能

FirstName,spa

)设计

GO指针

图表注释： 指向页面的指针由数据库文件编号和页码组成。所以，指针值为5：4567指向数据库文件＃5的第4567页。大部分示例值都来自AdventureWorks数据库中的Person.Contact表。为了说明的目的，还添加了其余一些内容。卡尔·奥尔森是样本中最受欢迎的名字。有不少Karl Olsens，他们的条目跨越了整个中级索引页面。blog

图1 - 索引的垂直切片 为了清晰起见，图表与如下方面的典型索引不一样：典型索引中每页的条目数量将大于图中所示的数量，所以，除根以外的每一个级别的页面数量将大于所示的数量。尤为是，叶级将比咱们的空间限制图中显示的要多得多。实际索引的条目在页面上不排序。这是页面的条目偏移指针，提供顺序访问条目。（有关偏移指针的更多信息，请参排序

索引的物理顺序和逻辑顺序之间的相关性每每比图中所示的要高。索引的物理和逻辑顺序之间缺少相关性被称为外部碎片，在第11级 - 碎片中讨论。如前所述，一个指数能够有多个中间水平。就好像咱们的白页用户正在寻找海伦·迈耶，打开电话簿，发现第一页，只有第一页是粉红色的。在粉色页面的排序条目列表中，有一个表示“对于”费尔南德斯，塞尔达“和”奥尔森，卡尔“之间的名字见蓝色页面5：431。当咱们的用户转到蓝页5：431时，该页面上的一个条目说：“Kumar，Kevin和Nara，Alison之间的名字见第5页：2006”。粉红色的页面对应于根，蓝色页面对应中间层次，白色页面是叶子。 指数深度 根页面的位置与索引的其余信息一块儿存储在系统表中。每当SQL Server须要访问与索引键值相匹配的索引条目时，它都会从根页面开始，并在索引中的每一个级别处理一个页面，直到到达包含该索引键的条目的叶级页面。在咱们的十亿行表中的例子中，五个页面读取将SQL Server从根页面转移到叶级页面及其所需的条目;在咱们的图解例子中，三个阅读就足够了。在汇集索引中，该叶级别条目将是实际的数据行;在非汇集索引中，此条目将包含聚簇索引键列或RID值。索引的级数或深度取决于索引键的大小和条目数。在AdventureWorks数据库中，没有索引的深度大于三。在具备很是大的表格或很是宽的索引键列的数据库中，可能会出现6或更大的深度。 sys.dm_db_index_physical_stats函数提供有关索引的信息，包括索引类型，深度和大小。这是一个能够查询的表值函数。清单1中显示的示例返回SalesOrderDetailtable的全部索引的摘要信息。

SELECT OBJECT_NAME(P.OBJECT_ID) AS 'Table'

, I.name AS 'Index'

, P.index_id AS 'IndexID'

, P.index_type_desc

, P.index_depth

, P.page_count

FROM sys.dm_db_index_physical_stats (DB_ID(),

OBJECT_ID('Sales.SalesOrderDetail'),

NULL, NULL, NULL) P

JOIN sys.indexes I ON I.OBJECT_ID = P.OBJECT_ID

AND I.index_id = P.index_id;

清单1：查询sys.dm_db_index_physical_stats函数结果如图2所示。

阅第4级 - 页面和范围。）

图2：查询sys.dm_db_index_physical_stats函数的结果相反，清单2中显示的代码请求特定索引的详细信息，即SalesOrderDetail表的表的uniqueidentifier列上的非汇集索引。它会为每一个索引级返回一行，如图3所示。 清单2：查询sys.dm_db_index_physical_stats获取详细信息。

SELECT OBJECT_NAME(P.OBJECT_ID) AS 'Table'

, I.name AS 'Index'

, P.index_id AS 'IndexID'

, P.index_type_desc

, P.index_level

, P.page_count

FROM sys.dm_db_index_physical_stats (DB_ID(), OBJECT_ID('Sales.SalesOrderDetail'), 2, NULL, 'DETAILED') P

JOIN sys.indexes I ON I.OBJECT_ID = P.OBJECT_ID

AND I.index_id = P.index_id;

图3：查询sys.dm_db_index_physical_stats获取详细信息的结果

从图3的结果能够看出： •这个指数的叶级分布在407页。 •惟一的中间级别只须要两页。 •根级始终是一个页面。索引的非叶部分的大小一般是叶级的大小的十分之一至二百分之一;取决于哪些列包括搜索关键字，书签的大小，以及哪些（若是有的话）被包括的列被指定。换句话说，相对而言，指数很是宽泛且很短。这与大多数索引示例图不一样，好比图1中的索引示例图，索引图每每比较高并且很窄。请记住，包含的列仅适用于非聚簇索引，它们只出如今叶级别条目中;它们从较高级别的条目中被省略，这就是为何它们不添加到非叶级别的大小。因为聚簇索引的叶级别是该表的数据行，所以只有聚簇索引的非叶子部分是附加信息，须要额外的存储空间。不管索引是否建立，数据行都会存在。所以，建立汇集索引可能须要时间并消耗资源;可是当建立完成时，数据库中消耗的空间不多。结论索引的结构使SQL Server可以快速访问特定索引键值的任何条目。一旦找到该条目，SQL Server就能够： •访问该条目的行。 •从该点开始以升序或降序的顺序遍历索引。这种索引树结构已经使用了很长时间，甚至比关系数据库还要长，而且随着时间的推移已经证实了它本身。本文是SQL Server索引阶梯的一部分