聊聊Mysql索引和redis跳表

时间 2020-07-10

标签聊聊 mysql 索引 redis 栏目 MySQL 繁體版

原文原文链接

摘要

面试时，交流有关mysql索引问题时，发现有些人可以涛涛不绝的说出B+树和B树，平衡二叉树的区别，却说不出B+树和hash索引的区别。这种一看就知道是死记硬背，没有理解索引的本质。本文旨在剖析这背后的原理，欢迎留言探讨html

若是对如下问题感到困惑或只知其一;不知其二，请继续看下去，相信本文必定会对你有帮助mysql

首先为何要把mysql索引和redis跳表放在一块儿讨论呢，由于他们解决的都是同一种问题，用于解决数据集合的查找问题，即根据指定的key，快速查到它所在的位置（或者对应的value）面试

当你站在这个角度去思考问题时，还会不知道B+树索引和hash索引的区别吗redis

如今咱们将问题领域边界划分清楚了，就是为了解决数据集合的查找问题。这一块须要考虑哪些问题呢算法

咱们看下几种经常使用的查找结构sql

hash 数据库

hash是key,value形式，经过一个散列函数，可以根据key快速找到value数据结构

B+树 函数

B+树是在平衡二叉树基础上演变过来，为何咱们在算法课上没学到B+树和跳表这种结构呢。由于他们都是从工程实践中获得，在理论的基础上进行了妥协。mysql索引

B+树首先是有序结构，为了避免至于树的高度过高，影响查找效率，在叶子节点上存储的不是单个数据，而是一页数据，提升了查找效率，而为了更好的支持范围查询，B+树在叶子节点冗余了非叶子节点数据，为了支持翻页，叶子节点之间经过指针链接。

跳表

跳表是在链表的基础上进行扩展的，为的是实现redis的sorted set数据结构。 level0: 是存储原始数据的，是一个有序链表，每一个节点都在链上 level0+: 经过指针串联起节点，是原始数据的一个子集，level等级越高，串联的数据越少，这样能够显著提升查找效率，

数据结构	实现原理	key查询方式	查找效率	存储大小	插入、删除效率
Hash	哈希表	支持单key	接近O(1)	小，除了数据没有额外的存储	O(1)
B+树	平衡二叉树扩展而来	单key,范围，分页	O(Log(n)	除了数据，还多了左右指针，以及叶子节点指针	O(Log(n)，须要调整树的结构，算法比较复杂
跳表	有序链表扩展而来	单key，分页	O(Log(n)	除了数据，还多了指针，可是每一个节点的指针小于<2,因此比B+树占用空间小	O(Log(n)，只用处理链表，算法比较简单

对LSM结构感兴趣的能够看下cassandra vs mongo (1)存储引擎

有用点个赞，谢谢

https://www.cnblogs.com/Elliott-Su-Faith-change-our-life/p/7545940.html