若是不是严格要求“缓存和数据库”必须保证一致性的话,最好不要作这个方案:即 读请求和写请求串行化,串到一个内存队列里面去。串行化能够保证必定不会出现不一致的状况,但会致使系统吞吐量大幅度下降。
解决这个问题的最经典的模式,就是Cache Aside Pattern。
Cache Aside Pattern:
(1)读的时候先读缓存,若是缓存不存在的话就读数据库,取出数据库后更新缓存;若是存在的话直接读取缓存的信息。
(2)写的时候,先更新数据库,再删除缓存。
说到这个问题,又会出现不少问题:
(1)为何是删除缓存,而不是更新缓存?
(2)为何是先更新数据库,再删除缓存?不是先删除缓存,再更新数据库?
写的时候为何是删除缓存不是更新缓存?
不少时候复杂的缓存场景,缓存不是仅仅从数据库中取出来的值。多是关联多张表的数据并经过计算才是缓存须要的值。而且,更新缓存的代价有时候很高。对于须要频繁写操做,而读操做不多的时候,每次进行数据库的修改,缓存也要随之更新,会形成系统吞吐的降低,但此时缓存并不会被频繁访问到,用到的缓存才去算缓存。
删除缓存而不是更新缓存,是一种懒加载的思想,不是每次都重复更新缓存,只有用到的时候才去更新缓存,同时即便有大量的读请求,实际也就更新了一次,后面的请求不会重复读。
Cache Aside Pattern存在的问题
问题:先更新数据库,再删除缓存,若是更新缓存失败了,致使数据库中是新数据,缓存中是旧数据,就出现数据不一致的问题。
解决思路:先删除缓存,再更新数据库。
问题:上面的方案存在不足,若是删除完缓存更新数据库时,若是一个请求过来查询数据,缓存不存在,就查询数据库的旧数据,更新旧数据到缓存中。随后数据更新完成,修改了数据库的数据,此时缓存和数据库的数据就会出现不一致了。高并发下会出现这种数据库+缓存不一致的状况。 若是不采用给缓存设置过时时间策略,该数据永远都是脏数据。
解决方案:采用双删除策略。写请求先删除缓存,再去更新数据库,等待一段时间后异步删除缓存。这样能够保证在读取错误数据时能及时被修正过来。
还有一种策略,就是:写请求先修改缓存为指定值,而后再去更新数据库,再更新缓存。读请求过来后,会先读缓存,判断是指定值后就进入循环读取状态,等到写请求更新缓存。若是循环超时就去数据库读取数据,更新缓存。
这种方案保证了读写的一致性,但因为读请求等待写请求的完成,会下降系统的吞吐量。