

本期问题程序员
QUESTIONweb
为何用了索引以后,查询就会变快?数据库
相信不少程序员朋友对数据的索引并不陌生,最多见的索引是 B+ Tree 索引,索引能够加快数据库的检索速度,可是会下降新增、修改、删除操做的速度,一些错误的写法会致使索引失效等等。
微信
可是若是被问到,为何用了索引以后,查询就会变快?B+ Tree 索引的原理是什么?这时候不少人可能就不知道了,今天我就以 MySQL 的 InnoDB 引擎为例,讲一讲 B+ Tree 索引的原理。编辑器
索引的基础知识flex
MySQL 的基本存储结构是页,大概就是这个样子的:优化
在这里,咱们须要了解如下几点(很是重要):url
当咱们用 MySQL 的 InnoDB 引擎建立表,有且只能有一个主键;若是咱们没有显示地指定之间,那么MySQL 会自动生成一个隐含字段做为主键;spa
汇集索引:以主键建立的索引;汇集索引的叶子节点存储的是表中的数据;.net
非汇集索引:非主键建立的索引;非汇集索引在叶子节点存储的是主键和索引列;使用非汇集索引查询数据,会查询到叶子上的主键,再根据主键查到数据(这个过程叫作回表)。
页和页之间、页和数据之间的关系
咱们以汇集索引作讲解,页和页之间、以及页和数据之间的关系是这样的:
数据页和数据页之间,组成一个双向链表;
每一个数据页中的记录,是一个单向链表;
每一个数据页都根据内部的记录生成一个页目录(Page directory),若是是主键的话,能够在页目录中使用二分法快速定位;
若是咱们根据一个非主键、非索引列进行查询,那么须要遍历双向链表,找到所在的页;再遍历页内的单向链表;若是表内数据很大的话,这样的查询就会很慢。
B+ Tree 索引的原理
先让咱们看看 B+ Tree 索引大概是什么样子(以汇集/主键索引为例):
假如这时候咱们要查询 id = 16 的数据:
查询页-1,找到页-2 存储的是小于 30 的数据;
查询页-2,找到页-5 存储的是 10~20 的数据;
查询页-5,找到 id = 16 的数据。
很显然,没有用索引的时候,须要遍历双向链表来定位对应的页,而有了索引,则能够经过一层层“目录”定位到对应的页上。
为何 B+ Tree 索引会下降新增、修改、删除的速度
B+ Tree 是一颗平衡树,若是对这颗树新增、修改、删除的话,会破坏它的原有结构;
咱们在作数据新增、修改、删除的时候,须要花额外的时间去维护索引;
正由于这些额外的开销,致使索引会下降新增、修改、删除的速度。
如今你是否理解了 B+ Tree 索引的原理?
最后再留一个思考题:为何官方建议使用自增加主键做为索引?你们能够在留言中写下你的答案。
END
相关文章推荐

本文分享自微信公众号 - 会点代码的大叔(CodeDaShu)。
若有侵权,请联系 support@oschina.cn 删除。
本文参与“OSC源创计划”,欢迎正在阅读的你也加入,一块儿分享。