索引全攻略

时间 2021-08-13

标签 sql 数据库服务器 ide 性能优化 url .net 设计指针栏目 SQL 繁體版

原文原文链接

一概述能够利用索引快速访问数据库表中的特定信息。索引是对数据库表中一个或多个列的值进行排序的结构。索引提供指针以指向存储在表中指定列的数据值，而后根据指定的排序次序排列这些指针。数据库使用索引的方式与使用书的目录很类似：经过搜索索引找到特定的值，而后跟随指针到达包含该值的行二索引的两种类型：汇集索引=簇集索引汇集索引基于数据行的键值在表内排序和存储这些数据行。因为数据行按基于汇集索引键的排序次序存储，所以汇集索引对查找行颇有效。每一个表只能有一个汇集索引，由于数据行自己只能按一个顺序存储。数据行自己构成汇集索引的最低级别。只有当表包含汇集索引时，表内的数据行才按排序次序存储。若是表没有汇集索引，则其数据行按堆集方式存储。汇集索引对于那些常常要搜索范围值的列特别有效。使用汇集索引找到包含第一个值的行后，即可以确保包含后续索引值的行在物理相邻。例如，若是应用程序执行的一个查询常常检索某一日期范围内的记录，则使用汇集索引能够迅速找到包含开始日期的行，而后检索表中全部相邻的行，直到到达结束日期。这样有助于提升此类查询的性能。一样，若是对从表中检索的数据进行排序时常常要用到某一列，则能够将该表在该列上汇集（物理排序），避免每次查询该列时都进行排序，从而节省成本非汇集索引非汇集索引具备彻底独立于数据行的结构。非汇集索引的最低行包含非汇集索引的键值，而且每一个键值项都有指针指向包含该键值的数据行。数据行不按基于非汇集键的次序存储。在非汇集索引内，从索引行指向数据行的指针称为行定位器。行定位器的结构取决于数据页的存储方式是堆集仍是汇集。对于堆集，行定位器是指向行的指针。对于有汇集索引的表，行定位器是汇集索引键。只有在表上建立了汇集索引时，表内的行才按特定的顺序存储。这些行就基于汇集索引键按顺序存储。若是一个表只有非汇集索引，它的数据行将按无序的堆集方式存储非汇集索引能够建多个,二者都能改善查询性能非汇集索引与汇集索引同样有 B 树结构，可是有两个重大差异：数据行不按非汇集索引键的顺序排序和存储。非汇集索引的叶层不包含数据页。相反，叶节点包含索引行。每一个索引行包含非汇集键值以及一个或多个行定位器，这些行定位器指向有该键值的数据行（若是索引不惟一，则多是多行）。非汇集索引能够在有汇集索引的表、堆集或索引视图上定义另外惟一索引惟一索引能够确保索引列不包含重复的值。在多列惟一索引的状况下，该索引能够确保索引列中每一个值组合都是惟一的。惟一索引既是索引也是约束。复合索引索引项是多个的就叫组合索引，也叫复合索引。复合索引使用时须要注意索引项的次序。二索引的建立有两种方法能够在 SQL Server 内定义索引: CREATE INDEX 语句和CREATE TABLE 语句 CREATE TABLE支持在建立索引时使用下列约束： PRIMARY KEY 建立惟一索引来强制执行主键 UNIQUE 建立惟一索引 CLUSTERED 建立汇集索引 NONCLUSTERED 建立非汇集索引注: 1 定义索引时，能够指定每列的数据是按升序仍是降序存储。若是不指定，则默认为升序 2 支持在计算列上建立索引 3 为索引指定填充因子可标识填充因子来指定每一个索引页的填满程度。索引页上的空余空间量很重要，由于当索引页填满时，系统必须花时间拆分它以便为新行腾出空间。三索引的维护语句 DBCC DBREINDEX 重建指定数据库中表的一个或多个索引 DBCC INDEXFRAG　　整理指定的表或视图的汇集索引和辅助索引碎片比较速度兼容性日志影响数据访问影响额外磁盘空间 DBCC 最快最好大,但能经过把操做过程当中数据不须要大 DBREINDEX 能够重故障还原模型设能访问，影响大建全部为简单减小日志有索引 DBCC 慢但可必须分小数据未被锁定须要小 INDEXDEFRAG 随时终别指定止执行 drop index 中等必须分大,但能经过把仅在操做执行时中等，操做在 create index 别指定故障还原模型设锁定数据 tempdb中进行为简单减小日志四查看索引的方法 sp_indexes 返回指定远程表的索引信息 INDEXKEY_PROPERTY 返回有关索引键的信息 sysindexes系统表数据库中的每一个索引和表在表中各占一行，该表存储在每一个数据库中五能够经过执行计划查看sql语句执行时是否创建在索引之上好比 CREATE TABLE Test (Field_1 int NOT NULL, Field_2 int CONSTRAINT PK_Test PRIMARY KEY CLUSTERED (Field_1)) CREATE index IX_Test ON Test (Field_2) 1 SELECT * FROM Test WHERE Field_2 =408 执行计划能够看出使用了IX_Test索引 2 SELECT * FROM Test WHERE Field_1 =1 执行计划能够看出使用了PK_Test 3 但若是是SELECT * FROM Test with (index(IX_Test)) WHERE Field_1 =1 则指定使用索引六索引的具体使用 (转贴) 1）索引的设计 A:尽可能避免表扫描检查你的查询语句的where子句，由于这是优化器重要关注的地方。包含在where里面的每一列（column)都是可能的侯选索引，为能达到最优的性能，考虑在下面给出的例子：对于在where子句中给出了column1这个列。下面的两个条件能够提升索引的优化查询性能！第一：在表中的column1列上有一个单索引第二：在表中有多索引，可是column1是第一个索引的列避免定义多索引而column1是第二个或后面的索引，这样的索引不能优化服务器性能例如：下面的例子用了pubs数据库。 SELECT au_id, au_lname, au_fname FROM authors WHERE au_lname = ’White’ 按下面几个列上创建的索引将会是对优化器有用的索引 ?au_lname ?au_lname, au_fname 而在下面几个列上创建的索引将不会对优化器起到好的做用 ?au_address ?au_fname, au_lname 考虑使用窄的索引在一个或两个列上，窄索引比多索引和复合索引更能有效。用窄的索引，在每一页上将会有更多的行和更少的索引级别（相对与多索引和复合索引而言），这将推动系统性能。对于多列索引，SQL Server维持一个在全部列的索引上的密度统计（用于联合）和在第一个索引上的 histogram（柱状图）统计。根据统计结果，若是在复合索引上的第一个索引不多被选择使用，那么优化器对不少查询请求将不会使用索引。有用的索引会提升select语句的性能，包括insert,uodate,delete。可是，因为改变一个表的内容，将会影响索引。每个insert,update,delete语句将会使性能降低一些。实验代表，不要在一个单表上用大量的索引，不要在共享的列上（指在多表中用了参考约束）使用重叠的索引。在某一列上检查惟一的数据的个数，比较它与表中数据的行数作一个比较。这就是数据的选择性，这比较结果将会帮助你决定是否将某一列做为侯选的索引列，若是须要，建哪种索引。你能够用下面的查询语句返回某一列的不一样值的数目。 select count(distinct cloumn_name) from table_name 假设column_name是一个10000行的表，则看column_name返回值来决定是否应该使用，及应该使用什么索引。 Unique values Index 5000 Nonclustered index 20 Clustered index 3 No index 2) 镞索引和非镞索引的选择 <1:>镞索引是行的物理顺序和索引的顺序是一致的。页级，低层等索引的各个级别上都包含实际的数据页。一个表只能是有一个镞索引。因为update,delete语句要求相对多一些的读操做，所以镞索引经常能加速这样的操做。在至少有一个索引的表中，你应该有一个镞索引。在下面的几个状况下，你能够考虑用镞索引：例如：某列包括的不一样值的个数是有限的（可是不是极少的）顾客表的州名列有50个左右的不一样州名的缩写值，可使用镞索引。例如：对返回必定范围内值的列可使用镞索引，好比用between,>,>=,<,<=等等来对列进行操做的列上。 select * from sales where ord_date between ’5/1/93’ and ’6/1/93’ 例如：对查询时返回大量结果的列可使用镞索引。 SELECT * FROM phonebook WHERE last_name = ’Smith’ 当有大量的行正在被插入表中时，要避免在本表一个天然增加（例如，identity列）的列上创建镞索引。若是你创建了镞的索引，那么insert的性能就会大大下降。由于每个插入的行必须到表的最后，表的最后一个数据页。当一个数据正在被插入（这时这个数据页是被锁定的），全部的其余插入行必须等待直到当前的插入已经结束。一个索引的叶级页中包括实际的数据页，而且在硬盘上的数据页的次序是跟镞索引的逻辑次序同样的。 <2:>一个非镞的索引就是行的物理次序与索引的次序是不一样的。一个非镞索引的叶级包含了指向行数据页的指针。在一个表中能够有多个非镞索引，你能够在如下几个状况下考虑使用非镞索引。在有不少不一样值的列上能够考虑使用非镞索引例如：一个part_id列在一个part表中 select * from employee where emp_id = ’pcm9809f’ 查询语句中用order by 子句的列上能够考虑使用镞索引 3) 一个表列若是设为主键(primary key),它会自动生成一个聚簇索引这时不能直接使用Drop index Table1.Tableindex1语句必须删除主键约束，用语句:alter table table1 drop constraint 约束名(如pk_xxx) 最后补充全文索引请参考 [url]http://expert.csdn.net/Expert/topic/1594/1594455.xml?temp=.1432154[/url]