二叉树红黑树和B+树

时间 2019-12-05

标签二叉树栏目应用数学繁體版

原文原文链接

网上看到了一些知识点，这里作个笔记记录一下。mysql

一、二叉排序树的特色sql

a、树的左边节点比根节点小，右边节点比根节点大。数据库

b、左右子树也都是二叉排序树。数组

可是，在一些特殊状况下，好比插入数据是有序的，就会发生退化状况。性能

有序序列，二叉排序树退化成链表。设计

二、为了保证树的平衡，引入了平衡树。在插入数据的时候，同时调整这棵树，让它的节点尽量均匀分布。3d

红黑树就是平衡树的一种。指针

之因此要保证树的平衡性，是由于树的查找性能取决于树的高度，让树尽量平衡，就是为了下降树的高度。blog

jdk内置的TreeSet底层就是用的红黑树。排序

三、B树

B树是一种多路搜索树，他的每一个节点能够拥有多余两个孩子节点。M路的B树最多能拥有M个孩子节点。

这种多路的设计，能够进一步下降树的高度。

路数越多，树的高度越低。若是设计成无限多路，B树就退化成有序数组了。

B树通常用于文件系统索引。文件系统和数据库索引通常都存储在硬盘上的，若是数据量大的话，不必定能一次性加载到内存中。

若是一棵树没法一次性加载进内存，这时候B树的多路存储能力就出来了，能够每次加载B树的一个节点，而后一步步往下找。

若是在内存中，红黑树比B树效率更高，可是涉及到磁盘操做，B树就更优了。

四、B+树

B+树是在B树的基础上进行改造，数据都在叶子节点上，同时叶子节点之间还加了指针造成链表。

B+树通常应用在数据库索引中，这是由应用场景决定的。

select数据不必定只选一条，不少时候会选多条。

若是多条的话，B树须要作局部的中序遍历，可能要跨层访问。而B+树全部数据都在叶子节点，不用跨层。

同时因为有链表结构，只须要找到首尾，经过链表就能把全部数据取出。

问题：

B+树的查找和插入时间复杂度跟树的高度有关，大概是O（logN）

hash平均时间复杂度是O（1）

hash比B+树更快，为何mysql为何还用B+树来存索引呢？

这是由业务场景决定的，若是只选一条数据，确实hash更快。可是数据库中常常会选择多条，这时候因为B+树中索引有序，

而且又有链表相连，它的查询效率就比hash快不少了。

另外，数据库中的索引通常是存储在磁盘上，数据量大的状况可能没法一次装载入内存，B+树的设计能够容许数据分批加载，

同时树的高度较低，提升查询效率。