Redis缓存系列

1、缓存雪崩

缓存雪崩咱们能够简单的理解为:因为原有缓存失效,新缓存未到期间(例如:咱们设置缓存时采用了相同的过时时间,在同一时刻出现大面积的缓存过时),全部本来应该访问缓存的请求都去查询数据库了,数据库

而对数据库CPU和内存形成巨大压力,严重的会形成数据库宕机。从而造成一系列连锁反应,形成整个系统崩溃。缓存

缓存正常从Redis中获取,示意图以下:服务器

缓存失效瞬间示意图以下:网络

缓存雪崩的解决方案:并发

(1)碰到这种状况,通常并发量不是特别多的时候,使用最多的解决方案是加锁排队,伪代码以下:分布式

加锁排队只是为了减轻数据库的压力,并无提升系统吞吐量。假设在高并发下,缓存重建期间key是锁着的,这是过来1000个请求999个都在阻塞的。一样会致使用户等待超时,这是个治标不治本的方法!高并发

注意:加锁排队的解决方式分布式环境的并发问题,有可能还要解决分布式锁的问题;线程还会被阻塞,用户体验不好!所以,在真正的高并发场景下不多使用!性能

(2)给每个缓存数据增长相应的缓存标记,记录缓存的是否失效,若是缓存标记失效,则更新数据缓存,实例伪代码以下:线程

 

解释说明:日志

一、缓存标记:记录缓存数据是否过时,若是过时会触发通知另外的线程在后台去更新实际key的缓存;

二、缓存数据:它的过时时间比缓存标记的时间延长1倍,例:标记缓存时间30分钟,数据缓存设置为60分钟。 这样,当缓存标记key过时后,实际缓存还能把旧数据返回给调用端,直到另外的线程在后台更新完成后,才会返回新缓存。

关于缓存崩溃的解决方法,这里提出了三种方案:使用锁或队列、设置过时标志更新缓存、为key设置不一样的缓存失效时间,还有一各被称为“二级缓存”的解决方法,有兴趣的读者能够自行研究。

2、缓存穿透

缓存穿透是指用户查询数据,在数据库没有,天然在缓存中也不会有。这样就致使用户查询的时候,在缓存中找不到,每次都要去数据库再查询一遍,而后返回空(至关于进行了两次无用的查询)。

这样请求就绕过缓存直接查数据库,这也是常常提的缓存命中率问题。

 缓存穿透解决方案:

(1)采用布隆过滤器,将全部可能存在的数据哈希到一个足够大的bitmap中,一个必定不存在的数据会被这个bitmap拦截掉,从而避免了对底层存储系统的查询压力。

(2)若是一个查询返回的数据为空(不论是数据不存在,仍是系统故障),咱们仍然把这个空结果进行缓存,但它的过时时间会很短,最长不超过五分钟。

经过这个直接设置的默认值存放到缓存,这样第二次到缓存中获取就有值了,而不会继续访问数据库,这种办法最简单粗暴!

把空结果也给缓存起来,这样下次一样的请求就能够直接返回空了,便可以免当查询的值为空时引发的缓存穿透。同时也能够单独设置个缓存区域存储空值,对要查询的key进行预先校验,而后再放行给后面的正常缓存处理逻辑。

 3、缓存预热

 缓存预热就是系统上线后,提早将相关的缓存数据直接加载到缓存系统。避免在用户请求的时候,先查询数据库,而后再将数据缓存的问题!用户直接查询事先被预热的缓存数据!

 缓存预热解决方案:

(1)直接写个缓存刷新页面,上线时手工操做下;

(2)数据量不大,能够在项目启动的时候自动进行加载;

(3)定时刷新缓存;

4、缓存更新

除了缓存服务器自带的缓存失效策略以外(Redis默认的有6中策略可供选择),咱们还能够根据具体的业务需求进行自定义的缓存淘汰,常见的策略有两种:

(1)定时去清理过时的缓存;

(2)当有用户请求过来时,再判断这个请求所用到的缓存是否过时,过时的话就去底层系统获得新数据并更新缓存。

二者各有优劣,第一种的缺点是维护大量缓存的key是比较麻烦的,第二种的缺点就是每次用户请求过来都要判断缓存失效,逻辑相对比较复杂!具体用哪一种方案,你们能够根据本身的应用场景来权衡。

5、缓存降级

当访问量剧增、服务出现问题(如响应时间慢或不响应)或非核心服务影响到核心流程的性能时,仍然须要保证服务仍是可用的,即便是有损服务。系统能够根据一些关键数据进行自动降级,也能够配置开关实现人工降级。

降级的最终目的是保证核心服务可用,即便是有损的。并且有些服务是没法降级的(如加入购物车、结算)。

在进行降级以前要对系统进行梳理,看看系统是否是能够丢卒保帅;从而梳理出哪些必须誓死保护,哪些可降级;好比能够参考日志级别设置预案:

(1)通常:好比有些服务偶尔由于网络抖动或者服务正在上线而超时,能够自动降级;

(2)警告:有些服务在一段时间内成功率有波动(如在95~100%之间),能够自动降级或人工降级,并发送告警;

(3)错误:好比可用率低于90%,或者数据库链接池被打爆了,或者访问量忽然猛增到系统能承受的最大阀值,此时能够根据状况自动降级或者人工降级;

(4)严重错误:好比由于特殊缘由数据错误了,此时须要紧急人工降级。