Amazon新一代云端关系数据库Aurora（下）

时间 2019-11-21

原文原文链接

本文由网易云发布。mysql

做者：郭忆算法

本篇文章仅限内部分享，如需转载，请联系网易获取受权。sql

故障恢复

MySQL基于Check point的机制，周期性的创建redo log与数据页的一致点。一旦数据库重启，从记录的Check point开始，根据redo log，对相应的数据页进行更新，对于已经提交的事务则确保事务更新持久化到硬盘的数据页中，对于未提交事务，利用数据页对应的roll pointer指针找到对应的undo log，进行回滚。MySQL 通常5分钟一个check point，在故障恢复过程当中，由一个线程负责redo log的回放，整个过程数据库实例彻底是停服的。数据库

与MySQL 相同的是Aurora 在故障恢复过程时，首先也必需要找到一个一致性点，可是与MySQL不一样的时，这个一致不要求全部的数据页是一致的，Aurora只要求找到VDL，确保日志的一致性。网络

基于read quorum机制，Aurora能够确保对于每个PG，读到知足writer quorum的redo log record，从而创建VDL。对于每一个存储节点，大于VDL的redo log记录将被删除。另外，虽然论文中并无提，可是因为Aurora的Cache是独立于数据库进程的，因此当仅是数据库实例重启时，Cache内Page LSN大于VDL的数据页一样也须要被清理掉，由于这部分数据页对应的redo log并无持久化到存储系统中。数据结构

创建VDL后，数据库便可以开始进行正常的读写访问。对于没有被提交的事务，因为undo写入的同时也会写redo，而且存在在同一个MTR中，因此undo也是完整的，根据undo能够完成对事务的回滚。可是与MySQL不一样的是未提交事务的回滚是后台异步在存储节点完成的。同时，Aurora的redo log的更新是根据page待修改记录的多少来按需进行合并的，而且因为底层存储系统redo log和数据页分散在多个存储节点的segment上，因此能够并行进行数据页的合并。架构

通过AWS 官方的测试，Aurora在10W 写QPS的压力下，故障恢复只须要10秒。另外值得一提的是，与MySQL Buffer Cache是进程内分配的内存空间不一样，Aurora的Buffer Cache是独立于数据库进程的，这样作的一个好处就是数据库宕机之后，不会丢失热点，固然这也仅限于数据库实例宕机，若是是系统宕机，就没用了。并发

性能异步

测试对象为Aurora，MySQL 5.6，MySQL5.7,分别在5种规格下（最大规格为32 vcpus，244G内存，最小的规格为2 vcpu，15G 内存，每种规格为前一个规格的一半vcpu和内存）的sysbench 纯读和纯写的压测。测试数据量为1G，因此是全内存的测试。ide

性能对比仍是很明显的，得益于大幅减小的跨网络IO以及基于log-structured storage的数据结构，Aurora在r3.8xlarge规格下写能够达到每秒12W。因为Aurora能够建立多个只读实例，因此Aurora在r3.8xlarge规格下读能够达到60W（文章中并无说起是否使用了Aurora，可是在全内存场景下，笔者猜想，应该是基于多个replica达到的）

总结

作架构设计的人有一个共识，没有最完美的架构设计，只有最适合的架构设计。Aurora 应该说就是这种理念最完美的诠释。在计算与存储分离的云基础设施之上，经过仅传输redo log，大幅减小跨网络的IO数据传输，将产生大量IO的数据页合并和持久化交由本地存储来解决，大幅减缓了网络延迟对数据库性能的影响。

另外，基于log-structured storage的数据页合并，相比Check point，能够更加高效的合并针对同一个数据页的更新，这些无疑提升了数据库的写入性能。多个replica共享同一个storage volume，多副本并发读取，大幅提升了数据库的读性能。整体来讲，

Aurora 对于云端数据库的架构设计具备划时代的意义，充分利用了云基础设施的架构特性，将数据库性能作到极致。

参考文档

1. Amazon Aurora: Design Considerations for High Throughput Cloud-Native Relational Databases SIGMOD’17, May 14 – 19, 2017, Chicago, IL, USA.

2. AWS 2016 re:Invent Amazon Aurora Deep Dive

3. AWS Aurora blog: https://aws.amazon.com/tw/blogs/database/category/aurora/?nc1=h_ls

4. Percona live 2016 Amazon Aurora Deep Dive

5. https://dev.mysql.com/

网易有数：企业级大数据可视化分析平台。面向业务人员的自助式敏捷分析平台，采用PPT模式的报告制做，更加易学易用，具有强大的探索分析功能，真正帮助用户洞察数据发现价值。可点击这里免费试用。

了解网易云：
网易云官网：https://www.163yun.com/
新用户大礼包：https://www.163yun.com/gift
网易云社区：https://sq.163yun.com/

Amazon新一代云端关系数据库Aurora（下）

故障恢复

更多高级特性

在线Point-in-time Restore

总结

参考文档

Amazon新一代云端关系数据库Aurora（下）

故障恢复

更多高级特性

在线Point-in-time Restore

总 结

参考文档

总结