如题,年前作了一个需求,涉及到Mysql大分页查询,整理一下,但愿对须要的小伙伴有帮助。前端
背景分页查询的性能瓶颈B+树简述B+比起二叉查找树,有什么优点?分页查询过程测试集解决方法1 延迟关联法:2 主键阈值法最后web
1SELECT 字段名
2FROM 表名
3WHERE _timestamp >= beginTime AND _timestamp <= endTime
4LIMIT n, m;
因为该数据是从其余数据源中导入的,因此_timestamp这个字段值几乎相同,这就致使了在咱们的查询范围内存在大约150万的数据。通常遇到这种状况,首先想到的就是是否须要给_timestamp添加索引,这张表上是存在_timestamp索引的。那么为何还会出现这个问题呢?这就要从分页查询自己提及了。sql
首先咱们要了解InnoDB存储引擎中的B+数索引。这里我简单总结一下:缓存
更矮,这就减小了IO次数。
因为非叶子节点不存储数据,上图查询任何数据,都须要3次IO,查询性能更稳定
因为叶子节点使用了链表链接,范围查询更简便。app
1.首先经过非主键索引查询出全部条件的主键
2.经过主键索引,定位到数据
3.不断重复上述操做
4.根据分页条件,肯定返回数据的启始位置以及数据量
5.返回数据
能够看出,初始位置值越大,定位时须要查询的数据就越多,查询效率也会越低性能
为了测试优化效果,我准备了150万测试数据(须要跑几分钟)。测试
1# 建表语句
2CREATE TABLE `test`(
3 `id` bigint(20) NOT NULL AUTO_INCREMENT COMMENT '主键',
4 `name` varchar(512) NOT NULL DEFAULT '无' COMMENT '建立人',
5 `_timestamp` timestamp NOT NULL DEFAULT CURRENT_TIMESTAMP ON UPDATE CURRENT_TIMESTAMP COMMENT '更新时间',
6 PRIMARY KEY (`id`),
7 KEY `ix_timestamp` (`_timestamp`)
8) ENGINE=InnoDB DEFAULT CHARSET=utf8 COMMENT='测试表';
9
10
11# 经过存储过程导入数据
12drop procedure idata;
13delimiter ;;
14create procedure idata()
15begin
16 declare i int;
17 set i=1;
18 while(i<=1500000)do
19 insert into test values(i, i, now());
20 set i=i+1;
21 end while;
22end;;
23delimiter ;
24
25call idata();
接着,咱们看一下使用索引的状况下,分页查询语句的耗时状况。优化
针对于limit,有不少优化的方法,好比前端加缓存、或者使用分页加载的方式展现数据。(大部分用户请求数据的初始开始都不会很大)。在咱们的使用场景中,调大超时时间的阈值也是能够的。
可是回到问题自己,问题出现的缘由就是分页语句随着初始位置的增长,会有性能问题,因此治本的办法,是对这个语句进行优化,有两个优化方法:ui
咱们先查询出符合要求的主键(因为查询的字段有索引,该索引的叶子节点就是主键,经过索引覆盖咱们能够省去一次回表操做。)
而后再经过主键索引查询数据,这就省去了遍历数据找初始位置数据的过程spa
若是你的主键是自增的,那么就能够经过条件推算出符合条件的主键最大值&最小值(这里也是经过索引覆盖省去了一次回表操做)
而后再根据阈值,取数据便可,一样省去了遍历数据找初始位置数据的过程
最后对文章作一下补充说明:
1.文中优化效果是仅凭借调用一次SQL的耗时给出的,并不科学,仅仅是为了让你们有一个直观的概念。
2.不管是延迟关联法,仍是主键阈值法。思想都是同样的,先把符合条件的主键找到,而后经过主键去定位符合条件的数据,这里优化了2个点:1.经过索引覆盖避免了回表;2.经过主键直接定位数据的方法,省去了在数据集中查询初始位置的过程
3.优化的效果随数据量增长而加强。万级别的数据优化效果可能并不明显。
最后,期待您的订阅和点赞,专栏每周都会更新,但愿能够和您一块儿进步,同时也期待您的批评与指正!