二叉树红黑树和B+树

网上看到了一些知识点,这里作个笔记记录一下。mysql

一、二叉排序树的特色sql

    a、树的左边节点比根节点小,右边节点比根节点大。数据库

    b、左右子树也都是二叉排序树。数组

 

 

可是,在一些特殊状况下,好比插入数据是有序的,就会发生退化状况。性能

有序序列,二叉排序树退化成链表。设计

 

二、为了保证树的平衡,引入了平衡树。在插入数据的时候,同时调整这棵树,让它的节点尽量均匀分布。3d

红黑树就是平衡树的一种。指针

之因此要保证树的平衡性,是由于树的查找性能取决于树的高度,让树尽量平衡,就是为了下降树的高度。blog

jdk内置的TreeSet底层就是用的红黑树。排序

 

三、B树

B树是一种多路搜索树,他的每一个节点能够拥有多余两个孩子节点。M路的B树最多能拥有M个孩子节点。

这种多路的设计,能够进一步下降树的高度。

路数越多,树的高度越低。若是设计成无限多路,B树就退化成有序数组了。

B树通常用于文件系统索引。文件系统和数据库索引通常都存储在硬盘上的,若是数据量大的话,不必定能一次性加载到内存中。

若是一棵树没法一次性加载进内存,这时候B树的多路存储能力就出来了,能够每次加载B树的一个节点,而后一步步往下找。

若是在内存中,红黑树比B树效率更高,可是涉及到磁盘操做,B树就更优了。

 

四、B+树

B+树是在B树的基础上进行改造,数据都在叶子节点上,同时叶子节点之间还加了指针造成链表。

B+树通常应用在数据库索引中,这是由应用场景决定的。

select数据不必定只选一条,不少时候会选多条。

若是多条的话,B树须要作局部的中序遍历,可能要跨层访问。而B+树全部数据都在叶子节点,不用跨层。

同时因为有链表结构,只须要找到首尾,经过链表就能把全部数据取出。

 

问题:

B+树的查找和插入时间复杂度跟树的高度有关,大概是O(logN)

hash平均时间复杂度是O(1)

hash比B+树更快,为何mysql为何还用B+树来存索引呢?

这是由业务场景决定的,若是只选一条数据,确实hash更快。可是数据库中常常会选择多条,这时候因为B+树中索引有序,

而且又有链表相连,它的查询效率就比hash快不少了。

另外,数据库中的索引通常是存储在磁盘上,数据量大的状况可能没法一次装载入内存,B+树的设计能够容许数据分批加载,

同时树的高度较低,提升查询效率。

相关文章
相关标签/搜索