掰扯下Innodb内存架构之BufferPool

  1. 咱们都知道mysql中的数据最终都会存到磁盘上,而咱们又知道磁盘的读写速度和cpu不是在一个数量级上,因此咱们猜想mysql存储引擎里必然有缓冲这一律念,本节咱们就好好掰扯掰扯myslq中的缓存.
  2. 先到官网看看,存储innodb存储引擎的结构
    image.png
    从上图咱们能够看到,INNODB架构,大体分为内存部分结构和磁盘部分结构,
    而内存部分又有BufferPool,ChangeBuffer,Adaptive Hash Index,LogBuffer等
    .咱们将按照本图内存部分结构一点一点掰扯每个缓存部分.
    这里推荐你们没事多喵喵官网:

14.5.1 Buffer Poolhtml

14.5.2 Change Buffermysql

14.5.3 Adaptive Hash Index算法

14.5.4 Log Buffer
3:首先来看BufferPoolsql

  • 说白了就是内存里一个最主要的缓存数据,而且在专用服务器上(这里能够理解mysql的生产环境) 80%的物理内存都分配给了buffer pool。 可见buffer的重要性。
  • 那数据在buffer里是怎么存储的呢? 在看官方给的架构图
    image.png
    先不细分析这个结构,大体看了下就是使用了LRU(least recently used 这个你们都很熟悉吧.不熟悉自行补充)算法. 而且把整个列表分了new和old两部分. 还有一点就是列表里每一项到底缓存数据的维度是什么?因此下面将分3个部分介绍 1:buffer pool 缓存的数据维度是什么? 2:为何LRU算法还有new和old部分,为何会这样涉及? 3:实战看下buffer pool相关的部分
    1:buffer pool 缓存的数据维度是什么?
    When room is needed to add a new page to the buffer pool, the least recently used page is evicted and a new page is added to the middle of the list. 从官方这句话,咱们能够得知每一项都是一页数据 . 这个后期写mysql索引文章的时候,会详细分析为何会是页数据为单位.
    2:为何LRU算法还有new和old部分,为何会这样设计?数据库

    其实你们想一想只有LRU算法的缺点就知道了. 看下图

    image.png

    就是随着新的数据页进来,列表中的数据会被大量置换出去. 没有达到缓存的目的. 其实官方也介绍了哪些状况下会出现这种状况[见下图].
    image.png
    说白了,全表扫描,什么mysqldump操做,select语句没有where条件,都会把大量数据放进buffer bool,即时这些数据并非热点数据, 但同时还会把热点数据给排挤出去.
    那增长了new和old部分,当出现上面操做,又是怎样保护热点数据呢?
    image.png
    可从上图看出,新读入的数据都放在old列表,而且不会替换掉new列表中的热点数据. 那问题来了,何时old列表中数据会进入new列表呢?
    实际上是进入buffer pool的数据,能被真正读取到, 并停留必定时间窗口,才会进入new列表 [有点像jvm内存分代,多大年龄能够进入老年代].缓存

    其实真实的状况是: 首先mysql会预读数据 [局部性原理,你们能够自行了解] 另外加上上面说的全表扫描 mysqldump等. 这两种状况, 使进入的buffer pool中的数据并不必定被读到, 因此不能直接把热点数据给置换掉,才弄出来new列表和old列表,而且old列表的数据被访问到,且经历过T时间[时间窗口] 才会进入new列表.服务器

    3:实战看下buffer pool相关的部分数据结构

  • 先本能到看下数据库关于buffer pool提供了哪些参数

窗口执行 show variables like '%buffer_pool%';
image.png
好像看不太懂,仍是从buffer pool的数据结构反推应该有哪些配置吧.架构

  • 首先咱们应该想到的是 一个mysql实例容许有几个buffer pool. 看上面架构图,好像只有一个,经过翻查资料,从INNODB1.0.X以后,容许有多个缓冲池实例. 因此找下确定有缓冲池实例的配置.
    没错 innodb_buffer_pool_instances=1 默认一个.
    另外 忽然扒到information_schema 里有INNODB_BUFFER_POOL_STATS表. 猜想从里能查看缓冲池状态信息. 先看看在说.
    image.png

能够看到有好多字段, 但有个POOL_ID=0 可见我本地就一个缓冲池.jvm

  • 其次就是缓冲池大小
    没错 innodb_buffer_pool_size=134217728
  • 有了大小了,咱们知道缓冲池分别new列表和old列表 因此确定有控制分割比例的配置
    没错 innodb_old_blocks_pct=37 官网给的是3/8处. 可见这个是个经验值,或者有什么破定律使这个值最合适. 不废话,去官网看看咋解释的.

image.png
innodb_old_blocks_pct表明old列表的大小,范围[5,95] 其余本身到官网看吧.

  • 不过从上图又发现时间窗口的配置了

innodb_old_blocks_time=1000 默认1s

综合innodb_old_blocks_pct和innodb_old_blocks_time 有两种状况
若是业务中常常出现表扫描, 这时候就该把innodb_old_blocks_pct调小, 把innodb_old_blocks_time调大,避免不少预读的数据进入缓冲区.
若是业务中没有大量的表扫描. 这时候就该把innodb_old_blocks_pct调大,把innodb_old_blocks_time减少,让热点数据尽快进入new列表.减小磁盘io,提升性能.

  • 如今咱们宏观看下整个buffer pool, 咱们能不能对他了解的更多.
    有多少个buffer pool 咱们已经知道. 大小咱们也知道. new列表和old列表大小咱们也知道. 如今惟一不知道的是buffer pool里缓存了多少页数据? 从old列表跑到new列表的量,频率等?
    还有个疑问点,上面POOL_SIZE=8191 和 innodb_buffer_pool_size=134217728 不是一个概念? 那POOL_SIZE=8191是什么概念呢?
    终于又从information_schema中发现两张表:
    image.png

INNODB_BUFFER_PAGE
INNODB_BUFFER_PAGE_LRU
先看第一张表:INNODB_BUFFER_PAGE
image.png 如今明白了 其实就是缓冲池中的全部的页信息.
在来看第二张表INNODB_BUFFER_PAGE_LRU
image.png
实际上是LRU列表中的页信息. 从这里咱们能够得出,BUFFER POOL 中不只仅只有一个LRU列表,还有其余缓存信息.

  • 那LRU列表中 old到new这些频率怎么看? 命中率怎么看? 其实上面有个图已经有这些信息了,在来看看.
    image.png

HIT_RATE:表示命中率 不用说,越高越好.
PAGES_MADE_YONG: 这个是从old列表到new列表的数量。

另外咱们发现: FREE_BUFFERS: 7704

DATABASE_PAGES: 487
        POOL_SIZE: 8191

7704+487=8191; 可见buffer_pool 中除来一个lru列表[目前是DATABASE_PAGES] 还有一个FREE_BUFFERS缓存. 其余的缓存咱们下一次在一一分析.

相关文章
相关标签/搜索