DB主从一致性架构优化4种方法

时间 2019-11-16

标签主从一致性架构优化方法栏目 Zookeeper 繁體版

原文原文链接

原创 2016-05-18 58沈剑 架构师之路数据库

需求缘起缓存

大部分互联网的业务都是“读多写少”的场景，数据库层面，读性能每每成为瓶颈。以下图：业界一般采用“一主多从，读写分离，冗余多个读库”的数据库架构来提高数据库的读性能。架构

这种架构的一个潜在缺点是，业务方有可能读取到并非最新的旧数据：并发

（1）系统先对DB-master进行了一个写操做，写主库分布式

（2）很短的时间内并发进行了一个读操做，读从库，此时主从同步没有完成，故读取到了一个旧数据性能

（3）主从同步完成优化

有没有办法解决或者缓解这类“因为主从延时致使读取到旧数据”的问题呢，这是本文要集中讨论的问题。线程

方案一（半同步复制）中间件

不一致是由于写完成后，主从同步有一个时间差，假设是500ms，这个时间差有读请求落到从库上产生的。有没有办法作到，等主从同步完成以后，主库上的写请求再返回呢？答案是确定的，就是你们常说的“半同步复制”semi-sync：游戏

（1）系统先对DB-master进行了一个写操做，写主库

（2）等主从同步完成，写主库的请求才返回

（3）读从库，读到最新的数据（若是读请求先完成，写请求后完成，读取到的是“当时”最新的数据）

方案优势：利用数据库原生功能，比较简单

方案缺点：主库的写请求时延会增加，吞吐量会下降

方案二（强制读主库）

若是不使用“增长从库”的方式来增长提高系统的读性能，彻底能够读写都落到主库，这样就不会出现不一致了：

方案优势：“一致性”上不须要进行系统改造

方案缺点：只能经过cache来提高系统的读性能，这里要进行系统改造

方案三（数据库中间件）

若是有了数据库中间件，全部的数据库请求都走中间件，这个主从不一致的问题能够这么解决：

（1）全部的读写都走数据库中间件，一般状况下，写请求路由到主库，读请求路由到从库

（2）记录全部路由到写库的key，在经验主从同步时间窗口内（假设是500ms），若是有读请求访问中间件，此时有可能从库仍是旧数据，就把这个key上的读请求路由到主库

（3）经验主从同步时间过完后，对应key的读请求继续路由到从库

方案优势：能保证绝对一致

方案缺点：数据库中间件的成本比较高

方案四（缓存记录写key法）

既然数据库中间件的成本比较高，有没有更低成本的方案来记录某一个库的某一个key上发生了写请求呢？很容易想到使用缓存，当写请求发生的时候：

（1）将某个库上的某个key要发生写操做，记录在cache里，并设置“经验主从同步时间”的cache超时时间，例如500ms

（2）修改数据库

而读请求发生的时候：

（1）先到cache里查看，对应库的对应key有没有相关数据

（2）若是cache hit，有相关数据，说明这个key上刚发生过写操做，此时须要将请求路由到主库读最新的数据

（3）若是cache miss，说明这个key上近期没有发生过写操做，此时将请求路由到从库，继续读写分离

方案优势：相对数据库中间件，成本较低

方案缺点：为了保证“一致性”，引入了一个cache组件，而且读写数据库时都多了一步cache操做

总结

为了解决主从数据库读取旧数据的问题，经常使用的方案有四种：

（1）半同步复制

（2）强制读主

（3）数据库中间件

（4）缓存记录写key

前3个方案在今年数据库大会（DTCC2016）上share过，相关的材料在网上能下载到。第4个方案是大会现场有其余同窗share的一个好方法，感谢这位同窗。

==【全文完，但愿大伙有收获】==

回【设置】线程数究竟设多少合理

回【秒杀】秒杀系统架构优化思路

回【消息】58到家通用实时消息平台架构细节

回【id】细聊分布式ID生成方法

回【监控】创业公司快速搭创建体化监控

回【百度】百度咋作长文本去重

【小游戏：回大于10的整数，随机返回好文，猜猜怎么实现的】

欢迎讨论，有问必答。

如有收获，帮忙转发。