前一阵无心中和同事讨论过一个SQL相关的题(经过一个小问题来学习SQL关联查询),很惭愧一个很是简单的问题因为种种缘由竟然没有回答正确,数据库知识方面我算不上技术好,谈起SQL知识的学习我得益于2008年进的一家公司,有几个DBA技术至关专业,正好手上有一个项目遇到了一些数据库查询性能问题,就试着想办法优化,因而本身将相法和DBA沟通后,竟然获得了他们的赞同,让我信心大增,后来一段时间我又主动找他们聊了一些其它的知识,因此在数据库索引这块我算是相对通常的.net程序员要更加有看法一些。当时咱们部门因为分工的不一样,部门20多人基本上工做中历来不和SQL打交道,后台的接口都由其它部门来完成了,咱们注意的 业务逻辑,因此有一些彻底不懂SQL的程序员。以后的四年我大部分都是作一些通用平台架构方面的工做,也比较少直接接触SQL,直到后来换了公司,特别是去年开始因为项目性质的变化,我开始慢慢又开始接触SQL。 html
工做时间的长短在某种程度上能决定一我的的技术水平,但每每技术水平和实际工做的产出不必定成正比。好比我上面提到那个SQL问题,不少有经验的程序员在第一个答案中每每回答错误,但他确实能将项目作好,由于你们平时观注的仍是结果,只要结果出来了比什么都强,至于为何出这样的结果通常也就不会多作分析研究。这种形式呢,对那些对技术提高没有强烈要求的人来说,已经够用了,多试几回,只要最终能出结果也就万事大吉了,作的多了,后续遇到相似的问题也就轻车熟路了,这就是所谓的经验,只知道这样作就能出结果。 程序员
其实这种工做学习方式呢,有一个比较显著的问题,就是对本身写出来的东西没有足够的信心,由于靠的是以往的经验。是出现错误以后经过不断的尝试来取得的经验,有一种探索的味道,在工做效率上会存在问题,由于总有你之前没有遇到过的场景,这样你可能对第一方案作屡次尝试才找到正解,反之的话,第一个方案可能花的时间稍长一些,但后续反复修改的次数会至关较少。算法
SQL索引目录 sql
借此次机会呢,将SQL索引的理解整理出来,供你们一块儿学习提升,这是个人学习笔记,有错误的地方,欢迎你们批评指正。下面是预计的目录:数据库
要想作好索引优化,知道索引的存储结构是相当重要的。谈到存储就须要了解SQL中的页和区的概念: 架构
知识了区以及页的概念,再看下数据表和这二者之间的联系, 表包含一个或多个分区,每一个分区在一个堆或一个汇集索引结构中包含数据行。从下图的结构中,咱们就看到了索引的重要结构B-树了。布局
索引中的底层节点称为叶节点。根节点与叶节点之间的任何索引级别统称为中间级。在汇集索引中,叶节点包含基础表的数据页。根节点和中间级节点包含存有索引行的索引页。每一个索引行包含一个键值和一个指针,该指针指向 B -树上的某一中间级页或叶级索引中的某个数据行。每级索引中的页均被连接在双向连接列表中。post
非汇集索引与汇集索引之间的显著差异在于如下两点:性能
咱们先看下B-树,这种索引结构有一个重要的参数n,它决定了索引存储页的布局,每一个存储页须要存放n个节点,以及n+1个指针。 这里咱们来作个计算:好比咱们的索引是一个整形数字,4个字节,指针须要8个字节,这里不考虑索引页标头信息的占用,算下最大的n,公式: 4n+8(n+1)<=8*1024 ,这个值是680,即最大可存放680个键,再按B-树充满度来取75%等于510,根结点有510个,那么它会有510*510个叶结点,这些叶结点会有510*510*510个指向最终记录的指针。这个数据足以说明绝多数状况下,只要三层就可以用。学习
索引中的键顺序与数据文件中的排序顺序相同,因此咱们的索引结构中,叶级均采用稿密索引。
它只为每一个存储块设计键-指针对,比稿密索引节约空间,出如今叶级之上的结构中。
要想回答这个问题,就须要了解索引在维护过程当中对于B-树的调整,SQL会经过必定的算法将B-树的充满度达到必定的平衡,这里就会涉及的节点的拆分以及合并,因此通常状况下不管对数据作怎样的更新,也不会出现下图中如此不平衡的状况。
注:若是问重建索引的好处时,若是你回答是为了平衡B-树,那么要谨慎回答。
数据存储的基础知识,索引结构对于咱们后续理解汇集索引以及非汇集索引都很是重要,也才有可能快速准确的作出优化方案。
参考:http://technet.microsoft.com/zh-cn/library/ms180978(v=sql.105).aspx