在分布式系统中,缓存和数据库同时存在时,若是有写操做,先操做数据库仍是先操做缓存呢?本文将分5种方案阐述展开对比,谢谢阅读~mysql
github地址,衷心感谢每一颗stargit
❝https://github.com/whx123/JavaHomegithub
❞
若是是一读(线程B)一写(线程A)操做,「先操做缓存,再操做数据库」。流程图以下所示:web
1.线程A发起一个写操做,第一步del cachesql
2.线程A第二步写入新数据到DB数据库
3.线程B发起一个读操做,cache miss缓存失效了。缓存
4.线程B从DB获取最新数据并发
5.线程B执行set cache,把从DB读到的数据,更新到缓存。异步
「这样看,没啥问题」。咱们再看第二个流程图,以下:编辑器
1.线程A发起一个写操做,第一步del cache
2.此时线程B发起一个读操做,cache miss
3.线程B继续读DB,读出来一个老数据
4.而后老数据设置入cache
5.线程A写入DB最新的数据
OK,酱紫,就有问题了吧,老数据入到缓存了,「每次读都是老数据啦,缓存与数据与数据库数据不一致了」。
上个方案是一读一写,若是是双写操做,「先操做缓存,在操做数据库」,会怎么样呢?
1.线程A发起一个写操做,第一步set cache
2.线程A第二步写入新数据到DB
3.线程B发起一个写操做,set cache
4.线程B第二步写入新数据到DB
「这样看,也没啥问题。」,可是有时候可能事与愿违,咱们再看第二个流程图,以下:
1.线程A发起一个写操做,第一步set cache
2.线程B发起一个写操做,第一步set cache
3.线程B写入数据库到DB
4.线程A写入数据库到DB
执行完后,缓存保存的是B操做后的数据,数据库是A操做后的数据,「缓存和数据库数据不一致」。
一写(线程A)一读(线程B)操做,「先操做数据库,再操做缓存」。
1.线程A发起一个写操做,第一步write DB
2.线程A第二步del cache
3.线程B发起一个读操做,cache miss
4.线程B从DB获取最新数据
5.线程B同时set cache
这种方案「没有明显的并发问题」,可是有可能「步骤二删除缓存失败」,虽然几率比较小,「优于方案一和方案二」,平时工做中也是使用方案三。
综上对比,咱们通常采用方案三,可是有没有完美全解决方案三的弊端的方法呢?
这个是方案三的改进方案,都是先操做数据库再操做缓存,咱们来看一下流程图:
经过数据库的「binlog」来「异步淘汰key」,以mysql为例 能够「使用阿里的canal将binlog日志采集发送到MQ队列」里面,而后「经过ACK机制 确认处理」 这条更新消息,删除缓存,保证数据缓存一致性。
可是呢还有个问题,「若是是主从数据库呢」?
主从DB问题:由于主从DB同步存在延时时间。若是删除缓存以后,数据同步到备库以前已经有请求过来时,「会从备库中读到脏数据」,如何解决呢?解决方案以下流程图:
综上所述,在分布式系统中,缓存和数据库同时存在时,若是有写操做的时候,「先操做数据库,再操做缓存」。以下: