Mysql B+树索引笔记

时间 2019-12-06

标签 mysql 索引笔记栏目 MySQL 繁體版

原文原文链接

声明

本文内容是简单整理了连接为 juejin.im/post/5a6873… 的博客内容。若有侵权请告知，谢谢！mysql

索引原理

经过不断缩小想要得到数据的范围来筛选出最终想要的结果，同时把随机事件变成顺序事件。通俗解释，经过一组规则来缩小数据查询范围、减小查询次数，这组规则就是索引。算法

B+树索引

描述

真实的数据存在于叶子节点；
非叶子结点不存储真实数据，只存储指引搜索方向的数据项；

B+树如何提升数据库性能

数据库中的数据保存在磁盘上，访问磁盘的成本是访问内存的十万倍左右。因此想要提升数据库性能，必须控制访问磁盘次数，即控制磁盘IO次数。sql

B+树能够把磁盘IO次数控制在一个常数量级。举例说明：如上图所示，要查找43所表明的数据（如下简称43）。数据库

将根节点所在的磁盘块从磁盘上读取到内存中，在内存中查找43，发现43在21-48之间；
将21-48所在的磁盘块从磁盘上读取到内存中，在内存中查找43，发现43在41-48之间；
将41-48所在的磁盘款从磁盘上读取到内存中，在内存中查找到43;

读取磁盘块3次，即产生了3次IO。若是没有索引，则须要遍历全部的磁盘块。函数

真实状况下，3层的B+树能够表示上百万的数据。post

索引实现

MyISAM引擎

MyISAM的索引方式也叫作“非汇集”的。
MyISAM引擎使用B+Tree做为索引结构，叶节点的data域存放的是数据记录的地址。
MyISAM中索引检索的算法为首先按照B+Tree搜索算法搜索索引，若是指定的Key存在，则取出其data域的值，而后以data域的值为地址，读取相应数据记录。
在MyISAM中，主索引和辅助索引在结构上没有任何区别，只是主索引要求key是惟一的，而辅助索引的key能够重复。

InnoDB引擎

InnoDB的数据文件自己就是索引文件。在InnoDB中，表数据文件自己就是按B+Tree组织的一个索引结构，这棵树的叶节点data域保存了完整的数据记录。这个索引的key是数据表的主键，所以InnoDB表数据文件自己就是主索引。InnoDB的索引也叫作汇集索引。性能

由于InnoDB的数据文件自己要按主键汇集，因此InnoDB要求表必须有主键（MyISAM能够没有），若是没有显式指定，则MySQL系统会自动选择一个能够惟一标识数据记录的列做为主键，若是不存在这种列，则MySQL自动为InnoDB表生成一个隐含字段做为主键，这个字段长度为6个字节，类型为长整形。大数据

InnoDB的全部辅助索引都引用主键做为data域。辅助索引搜索须要检索两遍索引：首先检索辅助索引得到主键，而后用主键到主索引中检索得到记录。优化

索引最左匹配特性

B+树是从左到右的顺序来创建搜索树的，因此检索数据时也是按照从左到右的顺序来检索的。unix

联合索引为 <a, b, c> , a、b、c均为表中一列。

数据举例	使用索引	备注
a,b,c	a,b,c	-
a	a	-
a,b	a,b	-
a,c	a	由于缺失b索引，c索引不会使用
b,c	-	由于缺失a索引，b,c索引不会使用
b	-	由于缺失a索引，b,c索引不会使用
c	-	由于缺失a,b索引，c索引不会使用

创建索引技巧

最左前缀匹配原则，很是重要的原则，mysql会一直向右匹配直到遇到范围查询(>、<、between、like)就中止匹配，好比a = 1 and b = 2 and c > 3 and d = 4 若是创建(a,b,c,d)顺序的索引，d是用不到索引的，若是创建(a,b,d,c)的索引则均可以用到，a,b,d的顺序能够任意调整。
=和in能够乱序，好比a = 1 and b = 2 and c = 3 创建(a,b,c)索引能够任意顺序，mysql的查询优化器会帮你优化成索引能够识别的形式
尽可能选择区分度高的列做为索引,区分度的公式是count(distinct col)/count(*)，表示字段不重复的比例，比例越大咱们扫描的记录数越少，惟一键的区分度是1，而一些状态、性别字段可能在大数据面前区分度就是0，那可能有人会问，这个比例有什么经验值吗？使用场景不一样，这个值也很难肯定，通常须要join的字段咱们都要求是0.1以上，即平均1条扫描10条记录
索引列不能参与计算，保持列“干净”，好比from_unixtime(create_time) = ’2014-05-29’就不能使用到索引，缘由很简单，b+树中存的都是数据表中的字段值，但进行检索时，须要把全部元素都应用函数才能比较，显然成本太大。因此语句应该写成create_time = unix_timestamp(’2014-05-29’);
尽可能的扩展索引，不要新建索引。好比表中已经有a的索引，如今要加(a,b)的索引，那么只须要修改原来的索引便可，固然要考虑原有数据和线上使用状况。

Mysql B+树索引 笔记

声明