分布式系统中,缓存和数据库同时存在,若是写操做先操做哪个?

前言

在分布式系统中,缓存和数据库同时存在时,若是有写操做的时候,先操做数据库仍是先操做缓存呢?先思考一下,可能会存在哪些问题,再往下看。下面我分几种方案阐述。mysql

缓存维护方案一

假设有一写(线程A)一读(线程B)操做,先操做缓存,在操做数据库。,以下流程图所示:sql

分布式系统中,缓存和数据库同时存在,若是写操做先操做哪个?

1)线程A发起一个写操做,第一步del cache数据库

2)线程A第二步写入新数据到DB缓存

3)线程B发起一个读操做,cache miss,并发

4)线程B从DB获取最新数据异步

5)请求B同时set cache分布式

这样看,没啥问题。咱们再看第二个流程图,以下:线程

分布式系统中,缓存和数据库同时存在,若是写操做先操做哪个?

1)线程A发起一个写操做,第一步del cache日志

2)此时线程B发起一个读操做,cache misscdn

3)线程B继续读DB,读出来一个老数据

4)而后老数据入cache

5)线程A写入了最新的数据

OK,酱紫,就有问题了吧,老数据入到缓存了,每次读都是老数据啦,缓存与数据与数据库数据不一致

缓存维护方案二

双写操做,先操做缓存,在操做数据库

分布式系统中,缓存和数据库同时存在,若是写操做先操做哪个?

1)线程A发起一个写操做,第一步set cache

2)线程A第二步写入新数据到DB

3)线程B发起一个写操做,set cache,

4)线程B第二步写入新数据到DB

这样看,也没啥问题。,可是有时候可能事与愿违,咱们再看第二个流程图,以下:

分布式系统中,缓存和数据库同时存在,若是写操做先操做哪个?

1)线程A发起一个写操做,第一步set cache

2)线程B发起一个写操做,第一步setcache

3)线程B写入数据库到DB

4)线程A写入数据库到DB

执行完后,缓存保存的是B操做后的数据,数据库是A操做后的数据,缓存和数据库数据不一致

缓存维护方案三

一写(线程A)一读(线程B)操做,先操做数据库,再操做缓存

分布式系统中,缓存和数据库同时存在,若是写操做先操做哪个?

1)线程A发起一个写操做,第一步write DB

2)线程A第二步del cache

3)线程B发起一个读操做,cache miss

4)线程B从DB获取最新数据

5)线程B同时set cache

这种方案没有明显的并发问题,可是有可能步骤二删除缓存失败,虽然几率比较小,优于方案一和方案二,平时工做中也是使用方案三。

综上对比,咱们通常采用方案三,可是有没有完美全解决方案三的弊端的方法呢?

缓存维护方案四

这个是方案三的改进方案,都是先操做数据库再操做缓存,咱们来看一下流程图:

分布式系统中,缓存和数据库同时存在,若是写操做先操做哪个?

经过数据库的binlog异步淘汰key,以mysql为例 能够使用阿里的canal将binlog日志采集发送到MQ队列里面,而后经过ACK机制 确认处理 这条更新消息,删除缓存,保证数据缓存一致性。

可是呢还有个问题,若是是主从数据库呢

缓存维护方案五

主从DB问题:由于主从DB同步存在同时延时时间若是删除缓存以后,数据同步到备库以前已经有请求过来时,会从备库中读到脏数据,如何解决呢?解决方案以下流程图:

分布式系统中,缓存和数据库同时存在,若是写操做先操做哪个?

缓存维护总结

综上所述,在分布式系统中,缓存和数据库同时存在时,若是有写操做的时候,先操做数据库,再操做缓存。以下:

(1)读取缓存中是否有相关数据

(2)若是缓存中有相关数据value,则返回

(3)若是缓存中没有相关数据,则从数据库读取相关数据放入缓存中key->value,再返回

(4)若是有更新数据,则先更新数据,再删除缓存

(5)为了保证第四步删除缓存成功,使用binlog异步删除

(6)若是是主从数据库,binglog取自于从库

(7)若是是一主多从,每一个从库都要采集binlog,而后消费端收到最后一台binlog数据才删除缓存

相关文章
相关标签/搜索