分布式数据库与缓存双写一致性方案解疑

在互联网领域,缓存因为其高并发和高性能的特性,已经在项目中被普遍使用。在读取缓存方面,你们没什么疑问,都是按照下图的流程来进行业务操做。数据库

a85ae8a27d758c19b45f5ce4713f4d94ae836a4c

可是在更新缓存方面,对于更新完数据库,是更新缓存呢,仍是删除缓存;又或者是先删除缓存,再更新数据库,其实你们存在很大的争议。目前笔者尚未见过一篇全面的文章,对这几种方案进行解析。因而笔者战战兢兢,顶着被你们吐槽的风险,写了这篇文章,若有不妥之处敬请在留言区指出,愿与你们一块儿探讨。缓存

本文将由如下三个部分组成:安全

  1. 讲解缓存更新策略网络

  2. 对每种策略进行缺点分析并发

  3. 针对缺点给出改进方案高并发

先作一个说明,从理论上来讲,给缓存设置过时时间,是保证最终一致性的解决方案。这种方案下,咱们能够对存入缓存的数据设置过时时间,全部的写操做以数据库为准,对缓存操做只是尽最大努力便可。也就是说若是数据库写成功,缓存更新失败,那么只要到达过时时间,则后面的读请求天然会从数据库中读取新值而后回填缓存。所以,接下来讨论的思路不依赖于给缓存设置过时时间这个方案。性能

在这里,咱们讨论三种更新策略:线程

  1. 先更新数据库,再更新缓存;blog

  2. 先删除缓存,再更新数据库;互联网

  3. 先更新数据库,再删除缓存。

应该没有人会问我,为何没有先更新缓存,再更新数据库这种策略吧?

1、先更新数据库,再更新缓存

这套方案,你们是广泛反对的。为何呢?有以下两点缘由。

d47e62d2b349aca45e42305ed6714efbe5ed61d9缘由一(线程安全角度)

同时有请求A和请求B进行更新操做,那么会出现

  1. 线程A更新了数据库;

  2. 线程B更新了数据库;

  3. 线程B更新了缓存;

  4. 线程A更新了缓存。

这就出现请求A更新缓存应该比请求B更新缓存早才对,可是由于网络等缘由,B却比A更早更新了缓存。这就致使了脏数据,所以不考虑。

相关文章
相关标签/搜索