既然平衡二叉树解决了普通二叉树的问题,那么mysql为什么不选择平衡二叉树做为索引呢?java
让咱们想想,若是咱们要把索引存起来,那么应该存哪些信息呢,它应该存储三块信息:mysql
索引的值:就是表里面索引列对应的值。git
数据的磁盘地址(经过磁盘地址找到当前数据)或者直接存储整条数据。面试
子节点的引用:咱们须要从根节点往下走,因此须要知道左右子节点的地址。 根据这三点,能够有以下大体的一个简单的结构图:sql
上图中数字表示的是索引的值,0x开头的表示磁盘地址,根节点中存了左右节点的引用。ide
咱们知道,页(Page)是 Innodb 存储引擎用于管理数据的最小磁盘单位,页的默认大小为16KB。页也就是上图中的节点,每查询一次节点就须要进行一次IO操做,IO操做是一种很是耗时的操做,不少业务系统的瓶颈都是卡在IO操做上,因此若是咱们须要提升查询效率的办法之一就是减小IO次数,那么问题就来了,AVL树一个节点上只存了一个关键字(索引值)+一个磁盘地址+左右节点的引用,这是远远达不到16KB的,会浪费了大量的空间。指针
上图中若是咱们要找到6这条数据,须要进行3次IO(获取一个节点就是一个IO操做),若是这棵树很高的话,就会进行大量的IO操做,因此说AVL树存在的最大问题就是空间利用不足,浪费了大量空间,数据量大的时候就会成为一颗瘦高的树,那么咱们能够怎么改进呢?答案很明显了,那就是每一个磁盘块多存一点东西,也就是说每一个磁盘多存几个关键字,由于关键字越多,路数越多;路数越多,树也就越矮越胖,相应的操做IO次数就会越少。视频
多路平衡树简称B树,又称B-树,和AVL树同样,B树在枝节点和叶子节点存储键值、磁盘地址、左右节点引用。请看下图的一个多路平衡树的示例:blog
相比较AVL树,B树一个磁盘上能够存多个关键字(值),并且有一个特色就是:教程
从上图能够很明显的看出,一样高度的树,B树能存的数据远远大于平衡二叉树。
以上图为例,假如咱们要找key=32这个数字,首先获取到根节点,发现18小于key,因此往右边走,获取到右边的数据,54和76,这时候遵循如下原则:
key<54,命中最左边分叉;
key=54,直接命中,返回数据;
54<key<76,走中间的一个分叉;
key=76,直接命中,返回数据;
key>76,命中右边分支; 这里由于key=32,因此走得是第1条,命中左边分支,这时候再去获取左边分支,获取到32和50,比较发现key=32,命中,返回数据。
从上面咱们能够看出B树效率相对于AVL树,在数据量大的状况效率已经提升了不少,那么为何MySQL仍是不选择B树做为索引呢? 那么接下来让咱们先看看改良版的B+树,而后再下结论吧!
B+树由B树改良而来,属于改良版的多路平衡查找树。 首先让咱们来看看B+树到底长什么样呢:
对比B+树,咱们能够发现一个很明显的区别就是叶子节点有一个箭头指引并且从左到右是有序的。
InnoDB中使用的B+树相比较于传统B+树,改进以后的B+树具备如下特色
它的关键字的数量是跟路数相等的。
B+树的根节点和枝节点中都不会存储数据,只有叶子节点才存储数据。而搜索到关键字不会直接返回,会到最后一层的叶子节点。
B+树的每一个叶子节点增长了一个指向相邻叶子节点的指针,它的最后一个数据会指向下一个叶子节点的第一个数据,造成了一个有序链表的结构。
它是根据左闭右开的区间来检索数据的 按照B+树的特色,咱们能够画出一个存储数据的简图,以下:
2020年在匆匆忙忙慌慌乱乱中就这么度过了,咱们迎来了新一年,互联网的发展如此之快,技术突飞猛进,更新迭代成为了这个时代的代名词,坚持下来的技术体系会愈来愈健壮,JVM做为现在是跳槽大厂必备的技能,若是你还没掌握,更别提以后更新的新技术了。
更多JVM面试整理: