Mysql-索引数据结构&引擎篇

Mysql能够说是最普遍使用的数据库之一了,体积小,成本低,开源(免费才是王道呀-。-),本文旨在和你们一块儿探索Mysql的一些相关知识,不只要会用它来写sql,更要学习它的底层设计和技术延伸。mysql

索引数据结构

Mysql索引是基于B+tree的数据结构来设计的,那么为何不使用二叉树,Hash(实际上是支持的),B-tree等结构来设计索引呢?sql

二叉树:

树的层数太高,容易退化成链表数据库

平衡二叉树,红黑树:

层数仍然太高,会大大增长系统的IO频率缓存

Hash

Mysql是支持Hash索引的,只不过Hash索引不支持范围查找,而咱们在平常工做中须要普遍的运用到范围查询数据结构

B-tree:

1.在B-tree和B+tree中,每个节点叫作一个磁盘页,每个磁盘页的大小是16K,那么相比较于B-tree是在每一个节点上都存储数据,B+tree是只在叶子节点上存储数据,相同层数下,B+tree能存储的数据量要大于B-tree
2.B+tree的叶子节点有双向指针,对于范围查找的效率能大大提高并发

存储引擎

Mysql中有不少种存储引擎,咱们这里主要介绍的是MyISAMInnoDB学习

打开不一样引擎的表的存储文件夹,会发现这两种引擎用来保存相关数据的文件不一样:
MyISAM设计

.frm文件:存储表结构
.MYD文件:存储数据
.MYI文件:存储索引
查询时,若是有索引,在MYI文件中根据索引获取数据地址,再去MYD文件中查找到数据

InnoDB指针

.frm文件:存储表结构
.ibd文件:存储索引和数据
索引和数据都存储在ibd文件

除了存储文件上的区别,MyISAM和InnoDB还有如下的区别:索引

  • 前者是非汇集索引,后者是汇集索引
  • 前者不支持事务,后者支持
  • 前者不支持外键,后者支持
  • 前者只支持表锁,后者支持表锁和行锁
  • 前者保存表的行数,后者每次仅限count(*)操做须要去扫描全表
  • delete表的时候,前者是从新建表,后者是一行行的删
    ···

那么,何时使用哪一个最好呢?通常来讲,系统业务涉及到查询占大部分,对事务需求度低,容忍度高的,能够使用MyISAM引擎,MyISAM查询效率要高于InnoDB。反之,系统涉及并发量大,须要大量的增删改操做,建议使用InnoDB引擎。

tips:MyISAM查询效率更高,是由于:InnoDB要缓存数据块,而MyISAM只要缓存索引块;在select的时候InnoDB须要去维护MVCC(多版本并发控制);InnoDB查询须要映射到块再到行,而MyISAM直接记录文件的offset,定位更快

汇集索引和非汇集索引

  • 对于主键索引和非主键索引来讲,MyISAM节点的主键索引和非主键索引都存放的是行数据的磁盘地址InnoDB非主键索引存储的是主键值,而主键索引里存储的是行数据,当进行非主键索引查询时,先在非主键索引中查找到对应的主键值,而后根据主键值再去主键索引里进行一次树查询,获取主键索引中存储的行数据。(这种第一次树查询定位主键,第二次再进行一次树查询的操做叫作回表
  • 根据索引存储方式的不一样,咱们把MyISAM的主键索引和非主键索引类型叫作非汇集索引,把InnoDB的主键索引类型叫作汇集索引,非主键索引类型叫作辅助索引(普通索引)。汇集的含义能够理解为索引和数据聚合在一块儿。
使用InnoDB时的tips:
1.基于上面的设计,InnoDB必须设置主键索引,因此通常建议咱们在进行表的设计的时候都要添加主键列,若是不设置主键,mysql会在表中寻找一个惟一列来当作主键索引,若是没有这样的列,它会去维护一个虚拟列,用以创建主键索引
2.主键尽量的要设置成自增整型类型,由于最终在B+tree中是须要去比较索引大小的,若是是非整型的,或者是无序的主键,还须要先去进行值转换,无疑增长了额外时间开支
相关文章
相关标签/搜索