在开发API的时候,有时候数据太多了,就须要分页读取。sql
这种方式就是会提供一个每页笔数(page size)来定义返回条目的最大数,提供一个页数(page number)来表示从哪里开始读取数据。数据库
例如:服务器
SELECT * FROM "CampusResumes" ORDER BY "Name" DESC LIMIT 5 OFFSET 10;
这句话的意思就是从该表中读取数据,按照Name字段降序排序,从第10笔数据后开始读取,一共读取5笔(可能不足5笔)。分布式
这就至关于page size = 5,page number = 3的分页读取。性能
Offset-based分页方式实现起来很是的简单,对用户来讲体验也比较好。可是还有有一些劣势的:大数据
整体来讲,当容许结果出现偏差的时候,Offset-based分页仍是很好用的。加密
为了解决Offset-based分页的那些问题,能够采用Cursor-based分页。blog
这种方式是这样的:客户端首先发送请求,请求里提供所需数据的数量。而后服务器响应请求,返回这些数量的数据(若是有这么多数据的话),同时还会返回一个游标(Cursor)。在下一次请求中,客户端除了发送请求数据的数量以外,还把这个cursor也传送过去,这个cursor就表示此次所要读取的数据的开始位置。排序
这看起来和Offset-based分页差异不大,可是却更有效率。数据库里面的数据能够根据cursor值来获取。索引
例如:
SELECT * FROM "CampusResumes" WHERE "Id" > 15 ORDER BY "Id" LIMIT 5;
这个例子里,上次请求返回的cursor(Id字段)值为15,此次要获取Id比15大的连续的5条数据。
这里的Id字段自己就是一个索引,因此查询起来很是快。
在此次请求的响应里,能够把本次结果的最后一条的Id做为cursor再返回去:
因此返回的cursor值为23,以供下次读取。
Cursor-based翻页的优势是:
Cursor-based翻页一般适用于大量和动态的数据集,可是它也有一些缺点:
对于Cursor字段的选择:
整体来讲Cursor-based翻页仍是更适合于高吞吐的应用,这种状况下客户端一般须要扫描整个数据集。