分布式之数据库和缓存双写一致性方案解析

一.为何写这边文章redis

首先,缓存因为其高并发和高性能的特性,已经在项目中被普遍使用。在读取缓存方面,你们没啥疑问,都是按照下午的流程来进行业务操做:数据库

clipboard.png
可是,在更新缓存方面,对于更新完数据库,是更新缓存呢,仍是删除缓存?又或者是先删除缓存,再更新数据库?其实这一块是存在很大的争议。缓存

2、文章结构网络

  1. 讲解缓存更新策略;
  2. 对每种策略进行缺点分析;
  3. 针对缺点给出改进方案;

3、正文并发

先作一个说明,从理论上来讲,给缓存设置过时时间,是保证最终一致性的解决方案。这种方案下,咱们能够对缓存的数据设置过时时间,全部的写操做以数据库为准,对缓存操做只是尽最大努力便可。也就是说若是数据库写成功,缓存更新失败,那么只要到达过时时间,则后面的读请求天然会从数据库中读取新值,而后回填缓存。所以,接下来讨论的思路不依赖于给缓存设置过时时间这个方案。在这里,咱们讨论三种更新策略:高并发

  • 先更新数据库,再更新缓存
  • 先删除缓存,再更新数据库
  • 先更新数据库,再删除缓存

为何没有先更新缓存,再更新数据库这种策略?答案不用说了吧。性能

4、先更新数据库,再更新缓存spa

这套方案,你们是广泛反对的,为何呢?有以下两点缘由:线程

缘由一:线程安装角度
同时又请求A和请求B进行更新操做,那么会出现:code

  1. 线程A更新了数据库
  2. 线程B更新了数据库
  3. 线程B更新了缓存
  4. 线程A更新了缓存

这就出现请求A更新缓存应该比请求B更新缓存早才对,可是由于网络等缘由,B比A更早更新了缓存。这就致使了脏数据,所以不考虑!

缘由2、业务场景角度
有以下两点:
1)若是你是一个写数据库场景比较多,而读数据场景比较少的业务需求,采用这种方案就会致使,数据压根还没读到,缓存就被频繁的更新,浪费性能。

2)若是你写入数据库的值,并非直接写入缓存的,而是要通过一系列负责的计算再写入缓存。那么,每次写入数据库后,都要再次计算写入缓存的值,无疑是浪费性能的。显然,删除缓存更为合适。

接下来讨论的就是争议最大的,先删除缓存,再更新数据库。仍是先更新数据库,再删除缓存的问题。

5、先删除缓存,再更新数据库

该方案会致使不一致的缘由:同时有一个请求A进行更新操做,另外一个请求B进行查询操做。那么就会出现如下情形:

  • 请求A进行写操做,删除缓存
  • 请求B查询发现缓存不存在
  • 请求B去数据库查询获得旧值
  • 请求B将旧值写入缓存
  • 请求A将新值写入数据库

上述状况就会致使不一致的请求出现。并且,若是不采用给缓存设置过时时间策略,该数据永远都是脏数据。
那么,该如何解决呢?采用延时双删除策略!伪代码以下:

public void write(String key, Object data){
    redis.delKey(key);
    db.updateData(data);
    Thread.sleep(1000);
    redis.deleKey(key);
}

解释一下:

  • 先淘汰缓存
  • 再写数据库(这两步和原来同样)
  • 休眠1秒,再次淘汰缓存

这么作,能够将1秒内所形成的缓存脏数据,再次删除!

相关文章
相关标签/搜索