InnoDB 中的缓冲池(Buffer Pool)

时间 2020-12-01

标签 html mysql 算法 sql 数据库缓存并发 dom 高并发性能栏目 MySQL 繁體版

原文原文链接

本文主要说明 InnoDB Buffer Pool 的内部执行原理，其生效的前提是使用到了索引，若是没有用到索引会进行全表扫描。html

结构

在 InnoDB 存储引擎层维护着一个缓冲池，经过其能够避免对磁盘频繁的IO操做。下面是其内部结构的概要图（实际没有这么简单，本文只着重说一下它的“读”、“写”缓存）。其本质就是将磁盘上的数据页移到内存中，以此来减小对磁盘数据的直接IO。mysql

能够看到内部含有一个小区域，叫作 Change Buffer，这个是用 InnoDB 的 "写"缓存，而外面的是 InnoDB 的 “读”缓存。算法

读缓存

预读

MySQL 内部通常都会使用缓冲池，而若是屡次语句操做的是相邻的记录，那么就会屡次进行磁盘读取，致使速度下降，因此 MySQL 通常在读取数据时都是采用预读方式，读取指定数据周围的多条数据。而在 InnoDB 引擎中的数据是以页为单位进行存储的，而且提出了“数据页”概念。数据页的结构以下，大小默认为 16K，关于数据页这里就不过多阐述，感兴趣能够查看原博客。对硬盘上的数据读取最小单位就是数据页。sql

而在数据页上面，还分为区(Extent)、段(Segment)、表空间(Tablespace)，它们之间的包含关系以下图。具体能够查看原博客。数据库

InnoDB 引擎在预读时，有两种预读算法。线性预读和随机预读。缓存

一、线性预读（innodb_read_ahead_threshold）

选择是否预读下一个 Extent 的数据。有一个重要的参数 innodb_read_ahead_threshold，若是当前 Extent 中连续读取的数据页超过规定值，就会将下一个 Extent 的数据也读到缓冲池中。innodb_read_ahead_threshold 的范围是 0-64（由于一个 Extent 也就64页）。并发

二、随机预读（innodb_random_read_ahead）

用来设置是否将当前 Extent 的剩余页也预读到缓冲池中，因为这种预读性能不稳定，因此MySQL 5.5开始默认关闭。dom

缓冲池的LRU算法

InnoDB 的缓冲池数据的存储算法是改进版的 LRU 算法，以此来避免了传统 LRU 算法的两个问题，预读失效和缓冲池污染。高并发

LRU 算法简单来讲，若是用链表来实现，将最近命中（加载）的数据页移在头部，未使用的向后偏移，直至移除链表。这样的淘汰算法就叫作 LRU 算法。可是其会含有前面说得两个问题。性能

一、预读失效

在磁盘上读取数据时，可能会由于操做不当致使多个用不到的数据页加载到缓冲池。从而致使以前常常被使用的数据页缓存被无用的数据页挤到尾部，甚至被移出缓存，那么就会下降性能。而 InnoDB 的解决方案是将缓冲池分为两部分，新生代和老年代，比例默认为5:3，分别存储经常使用的数据页以及不经常使用的数据页，新生代位于头部，新生代位于尾部，这两部分都有头部和尾部。当从磁盘的数据页移入缓冲池中时，首先是放入老年代的头部，而后进行筛选，使用到的数据页会移入新生代的头部，未使用的数据页会随着时间流逝而慢慢移入老年代的尾部，直至淘汰。

二、缓冲池污染。

在处理数据页时，若是须要对大量数据页进行筛选（可是没有用到），那么仍是会使大量的热点数据页被挤出。如 select * from student where name like '张%'；name字段包含索引，那么在执行时虽然会先加载到老年代的头部，可是由于每条数据都须要筛选，因此都会移入新生代头部，致使新生代热点数据页被挤到老年代甚至移除。InnoDB 为了解决这个问题，使用了 "老年代停留时间窗口" 机制，这个机制是设置一个时间，若是在老年代的数据页被调用后还须要去检查它在老年代的停留时间是否达到了这个规定时间，达到了才能移入新生代头部，不然只会移到老年代头部。

写缓存（Change Buffer）

写缓存(Change Buffer)在5.5以前叫作插入缓存(insert Buffer)，由于只支持插入的缓存，在随后版本又添加了 update、delete，因此更名 change Buffer。由于直接对磁盘进行IO操做会比较耗时，若是咱们的程序在高并发的场景，同时某段时间写操做很是多，那么若是直接更新到磁盘上数据库的压力就会很是大，甚至崩溃。为了不这种状况，能够错开高峰期，让数据在系统空闲时再更新到磁盘，那么该如何实现，Change Buffer就起到这样的做用。

执行

在更新语句进来时，首先会判断数据页缓存中有没有对应的数据，若是有直接更新对应的缓存数据，不然将其记录在 Change Buffer 中。随后(无论前面是哪一种状况都会执行)再将这条sql依次写入 redo log、bin log(Server 层的日志，全部执行引擎均可以用，而 redo log 是InnoDB内部维护的，bin log 通常用于主从复制)。

redo log落盘的时机

将日志中的sql更新到硬盘上的操做叫作“落盘(merge)”。

一、mysql系统后台会按期落盘

二、查询 redo log中sql操做过的数据时须要先落盘

三、mysql 正常关闭时

Change Buffer 适用场景

一、更新后马上须要读取该数据场景少。由于读取更新过的数据须要先落盘，那么 Change Buffer 存在的意义就没有了，同时还增长了redo log 写入的成本。

二、非惟一索引，若是使用的是惟一索引进行查询，那么操做的数据须要进行惟一性检查，因此须要将相应数据页先加载到缓冲池中，而后再判断，更新，过程当中不会用到 Change Buffer。

写入redo log不也是磁盘数据IO么？为何就比直接更新到磁盘上效率高？

使用 redo log 只是将操做存储进去，而更新到磁盘数据则是须要先读操做查找 B+ 树，找到数据后再进行写操做。