MySQL进阶篇(02)：索引体系划分，B-Tree结构说明

时间 2021-02-19

标签 mysql git github sql 数据库 segmentfault 缓存服务器数据结构架构栏目 MySQL 繁體版

原文原文链接

本文源码：GitHub·点这里 || GitEE·点这里mysql

1、索引简介

一、基本概念

首先要明确索引是什么：索引是一种数据结构，数据结构是计算机存储、组织数据的方式，是指相互之间存在一种或多种特定关系的数据元素的集合，例如：链表，堆栈，队列，二叉树等等。git

其次要清楚索引的做用：索引可使存储引擎快速找到数据记录，这是最基本的做用，索引是对查询速度最关键的影响，良好的索引设计可使查询的效率有质的飞越。github

索引的使用：若是查询语句使用全部，MySQL会在索引的数据结构上查询，若是查询到，就返回包含该索引的数据行。sql

二、索引的优势

惟一或者主键索引,保证列数据的惟一性
减小数据扫描量，快速查询数据；
数据有序的索引，能够将随机IO变成顺序IO；
有效的索引查询，能够避免排序和临时表；

三、索引分类

索引的种类很是多，如何分类取决多个场景和不一样的角度，常见的划分以下：数据库

产生做用：主键索引，普通索引，非空索引，全文索引；
覆盖字段：单列索引，组合索引；
数据结构：B-Tree索引，哈希索引，R-Tree索引；

注意：索引的实现是在存储引擎层面，相同的索引在不一样的存储引擎中，其实现方式可能都是不同的。segmentfault

2、索引用法详解

一、不一样索引特色

普通索引缓存

基本的索引，没有任何使用限制，主要用来加速数据查询。适合常常出如今查询条件或排序条件中的数据列。服务器

主键索引数据结构

特殊的惟一索引，不容许有空值，在建表的时候指定主键，就会建立主键索引，MySQL中最核心的索引，大量的业务数据都是基于主键查询。架构

惟一索引

普通索引相似，不一样的就是：索引列的值必须惟一，但容许有空值。若是是组合索引，则列值的组合必须是惟一性的。

全文索引

用于全文搜索，经过创建全文索引，基于分词的查询模式，能够极大的提高检索效率。

组合索引

建立的索引覆盖两个或者两个以上的列，适应组合查询的场景，也经常使用于要素验证的业务，例如判断用户身份ID，手机号，邮箱，是否为同一个用户。

二、管理索引语法

基础用户表

CREATE TABLE user_base (
    id INT (11) NOT NULL AUTO_INCREMENT COMMENT '主键ID',
    user_name VARCHAR (20) NOT NULL COMMENT '用户名',
    phone VARCHAR (20) NOT NULL COMMENT '手机号',
    email VARCHAR (32) DEFAULT NULL COMMENT '邮箱',
    card_id VARCHAR (32) DEFAULT NULL COMMENT '身份编号',
    create_time datetime DEFAULT NULL COMMENT '建立时间',
    state INT (1) DEFAULT '1' COMMENT '是否可用,0-不可用,1-可用',
    PRIMARY KEY (`id`)
) ENGINE = INNODB DEFAULT CHARSET = utf8 COMMENT = '用户基础表';

建立单列索引

CREATE INDEX card_id_index ON user_base(card_id);

修改添加索引

ALTER TABLE user_base ADD INDEX state_index(state) ;

建立组合索引

CREATE INDEX bind_index ON user_base(phone,card_id);

删除索引

DROP INDEX card_id_index ON user_base ;

修改索引

MySQL不支持真正修改索引的语法规范，能够经过删除旧索引，添加新索引的方式进行操做。

三、查询索引

分析MySQL查询，多数状况下用来分析执行语句的SQL中是否使用索引，是否产生临时表等性能相关问题。

基础用法

EXPLAIN SELECT * FROM user_base WHERE id='1';

参数说明

id：相同，按table列由上至下顺序执行，不一样，若是是子查询，id的序号会递增，id的值越大优先级越高，越先被执行；
select_type：表示查询的类型，主要是用于区别普通查询、联合查询、子查询等的复杂查询；

simple：简单select查询，查询中不包含子查询或者
primary：查询中若包含复杂的子部分，最外层查询则被标记为primary
subquery：select或where中包含子查询
derived：from中包含的子查询被标记为derived衍生，mysql会递归执行这些子查询，且生成临时表
union：第二个select出如今union后，标记为union
union-result：从union表获取结果的select

table：指当前执行计划中的数据表；
type：说明的是查询使用了哪一种类型，下面从好到差排序；

system-const：对查询的某部分进行优化并转换成一个常量时，会使用该类型
eq_ref：常见于主键或惟一索引扫描，表中只有一条记录与之匹配
ref：非惟一性索引扫描，返回匹配某个单独值的全部行
index：遍历索引结构，索引文件一般比数据文件小
all：遍历全表进行查询

possible_keys：在查询中可能使用到的索引；
key：在查询中实际使用到的索引；
key_len：查询中索引字段的最大可能长度，在不损失精确性的状况下，长度越短越好；
ref：表示本行被操做的对象的参照对象，多是一个常量用const表示，也多是其余表的key指向的对象；
rows：预估找到符合要求的记录所须要扫描的行数，扫描越少越好；
extra：执行计划中，一些十分重要的信息；

Using-Filesort：查询使用文件排序，最差的执行计划
Using-Temporary：临时表保存中间结果，比文件排序稍微强点
Using-Index：查询操做中使用了覆盖索引
Using-Where：代表使用了where过滤条件
Using-Join-Buffer:代表使用了链接缓存
Impossible-Where：表示where条件false,不能过滤元素
Distinct：优化distinct找到第一匹配的数据后即中止找一样值的动做
Select-Tables-Optimized-Away：没必要等到执行阶段再进行计算，查询执行计划生成的阶段即完成优化

3、B-Tree索引结构

一、B-Tree索引简介

MySQL官方比较推荐的索引结构类型，在实际的数据库开发中，基于MySQL中的表结构，大部分使用的都是B-Three索引结构，即二叉树的结构。能够加快数据的访问速度，存储引擎再也不须要进行全表扫描来获取数据，数据分布在各个索引节点上，B-Tree索引结构如图：

该结构是典型的二叉树结构，特色：数据值按照顺序存储的，每一个叶子节点到根部的距离是相同的，注意这里描述的是索引结构图。

实际存储结构上，数据顺序存储，每一个节点包含索引值，索引指向的数据行的值，指向子页的指针，指向叶子页的指针，这样才能把索引和数据结构组织起来，结构如图：

这样完整描述B-Tree索引的数据特色，基于树搜索提高效率，减小扫描数据，数据被顺序的组织起来，按照索引值顺序排列。

二、搜索规则

索引的根本做用，减小扫描的数据量，提高查询效率，基于B-Tree索引的结构的查询规则基本以下：

查询从索引的根节点开始，逐步搜索；
根节点的槽中存放指向子节点的指针，指向下层；
根据节点页的值和查询值比较，判断是否符合条件；
不断执行上述逻辑，直到查询完成；

注意：必需要强调一点，查询必须是在执行索引的基础上，才是该逻辑，正常的开发中多分析一下查询语句，有时候可能只是本身感受查询索引是执行的，实际多是失效的。

三、索引查询失效

好的索引设计十分重要，可是查询的时候极可能由于触发各类索引失效机制，致使SQL语句不执行索引搜索，严重损失性能，因此基于业务下数据查询特色，设计相对好用的索引结构，是十分关键的，这里涉及不少场景问题，后续再详细记录。

4、索引致使的问题

索引有时候并非最好的解决方式，当数据量庞大的时候，索引也会占据庞大的存储空间，这里提供一个业务测试场景，仅供参数：单表三个字符类型字段，两个字段使用索引结构，存储数据在700W量级，在A和B两个数据库，A数据库有索引结构，B数据库没有索引，A库占用的空间是B库的1.6倍，写入千万数据的速度也比B数据库慢9分钟。

这里只想说明一点：索引虽然好，使用稳当才能发挥做用。

5、源代码地址

GitHub·地址
https://github.com/cicadasmile/mysql-data-base
GitEE·地址
https://gitee.com/cicadasmile/mysql-data-base

推荐阅读：MySQL系列

序号	文章标题
01	MySQL基础：经典实用查询案例，总结整理
02	MySQL基础：从五个维度出发，审视表结构设计
03	MySQL基础：系统和自定义函数总结，触发器使用详解
04	MySQL基础：存储过程和视图，用法和特性详解
05	MySQL基础：逻辑架构图解和InnoDB存储引擎详解
06	MySQL基础：事务管理，锁机制案例详解
07	MySQL基础：用户和权限管理，日志体系简介
08	MySQL进阶：基于多个维度，分析服务器性能