前面我写了几篇关于 mysql 索引的文章,索引是 mysql 很是重要的一部分。你也可能常常会看到一些关于 mysql 军规、mysql 查询优化的文章,其实这些操做的背后都是基于必定的原理的,你要想明白这些原理,首先就得知道 mysql 底层的一些东西。mysql
我在这里举几个例子吧。sql
咱们都知道表的主键通常都要使用自增 id,不建议使用业务 id ,是由于使用自增 id 能够避免页分裂。这个其实能够至关于一个结论,你均可以直接记住这个结论就能够了。 可是若是你要弄明白什么是页分裂,或者什么状况下会页分裂,这个时候你就须要对 mysql 的底层数据结构要有必定的理解了。数据结构
我这里也稍微解释一下页分裂,mysql (注意本文讲的 mysql 默认为InnoDB 引擎)底层数据结构是 B+ 树,所谓的索引其实就是一颗 B+ 树,一个表有多少个索引就会有多少颗 B+ 树,mysql 中的数据都是按顺序保存在 B+ 树上的(因此说索引自己是有序的)。post
而后 mysql 在底层又是以数据页为单位来存储数据的,一个数据页大小默认为 16k,固然你也能够自定义大小,也就是说若是一个数据页存满了,mysql 就会去申请一个新的数据页来存储数据。mysql索引
若是主键为自增 id 的话,mysql 在写满一个数据页的时候,直接申请另外一个新数据页接着写就能够了。优化
若是主键是非自增 id,为了确保索引有序,mysql 就须要将每次插入的数据都放到合适的位置上。索引
当往一个快满或已满的数据页中插入数据时,新插入的数据会将数据页写满,mysql 就须要申请新的数据页,而且把上个数据页中的部分数据挪到新的数据页上。get
这就形成了页分裂,这个大量移动数据的过程是会严重影响插入效率的。效率
其实对主键 id 还有一个小小的要求,在知足业务需求的状况下,尽可能使用占空间更小的主键 id,由于普通索引的叶子节点上保存的是主键 id 的值,若是主键 id 占空间较大的话,那将会成倍增长 mysql 空间占用大小。原理
原本这篇文章是打算总结一下前面写的几篇关于 mysql 索引的文章的,也是打算多举几个例子的,结果发现光写了一个自增主键就写了一大堆了,而后时间也比较晚了,干脆就写到这吧,本来计划的几个其余例子后面再单独写吧。
若是你对 B+ 树不是很清楚的话,建议你去看下我下面这几篇推荐文章,欢迎关注。
推荐文章: