缓存雪崩、缓存穿透、缓存预热、缓存更新、缓存降级等问题(转载)

时间 2019-11-06

标签缓存雪崩穿透预热更新降级问题转载繁體版

原文原文链接

原文地址：https://blog.csdn.net/xlgen157387/article/details/79530877面试

前面一节说到了《为何说Redis是单线程的以及Redis为何这么快！》，今天给你们整理一篇关于Redis常常被问到的问题：缓存雪崩、缓存穿透、缓存预热、缓存更新、缓存降级等概念的入门及简单解决方案。sql

1、缓存雪崩

缓存雪崩咱们能够简单的理解为：因为原有缓存失效，新缓存未到期间(例如：咱们设置缓存时采用了相同的过时时间，在同一时刻出现大面积的缓存过时)，全部本来应该访问缓存的请求都去查询数据库了，而对数据库CPU和内存形成巨大压力，严重的会形成数据库宕机。从而造成一系列连锁反应，形成整个系统崩溃。数据库

缓存正常从Redis中获取，示意图以下：缓存

缓存失效瞬间示意图以下：服务器

缓存失效时的雪崩效应对底层系统的冲击很是可怕！大多数系统设计者考虑用加锁或者队列的方式保证来保证不会有大量的线程对数据库一次性进行读写，从而避免失效时大量的并发请求落到底层存储系统上。还有一个简单方案就时讲缓存失效时间分散开，好比咱们能够在原有的失效时间基础上增长一个随机值，好比1-5分钟随机，这样每个缓存的过时时间的重复率就会下降，就很难引起集体失效的事件。网络

如下简单介绍两种实现方式的伪代码：并发

（1）碰到这种状况，通常并发量不是特别多的时候，使用最多的解决方案是加锁排队，伪代码以下：分布式

//伪代码 public object GetProductListNew() { int cacheTime = 30; String cacheKey = "product_list"; String lockKey = cacheKey; String cacheValue = CacheHelper.get(cacheKey); if (cacheValue != null) { return cacheValue; } else { synchronized(lockKey) { cacheValue = CacheHelper.get(cacheKey); if (cacheValue != null) { return cacheValue; } else { //这里通常是sql查询数据 cacheValue = GetProductListFromDB(); CacheHelper.Add(cacheKey, cacheValue, cacheTime); } } return cacheValue; } }

加锁排队只是为了减轻数据库的压力，并无提升系统吞吐量。假设在高并发下，缓存重建期间key是锁着的，这是过来1000个请求999个都在阻塞的。一样会致使用户等待超时，这是个治标不治本的方法！高并发

注意：加锁排队的解决方式分布式环境的并发问题，有可能还要解决分布式锁的问题；线程还会被阻塞，用户体验不好！所以，在真正的高并发场景下不多使用！性能

（2）还有一个解决办法解决方案是：给每个缓存数据增长相应的缓存标记，记录缓存的是否失效，若是缓存标记失效，则更新数据缓存，实例伪代码以下：

//伪代码 public object GetProductListNew() { int cacheTime = 30; String cacheKey = "product_list"; //缓存标记 String cacheSign = cacheKey + "_sign"; String sign = CacheHelper.Get(cacheSign); //获取缓存值 String cacheValue = CacheHelper.Get(cacheKey); if (sign != null) { return cacheValue; //未过时，直接返回 } else { CacheHelper.Add(cacheSign, "1", cacheTime); ThreadPool.QueueUserWorkItem((arg) -> { //这里通常是 sql查询数据 cacheValue = GetProductListFromDB(); //日期设缓存时间的2倍，用于脏读 CacheHelper.Add(cacheKey, cacheValue, cacheTime * 2); }); return cacheValue; } }

解释说明：

一、缓存标记：记录缓存数据是否过时，若是过时会触发通知另外的线程在后台去更新实际key的缓存；

二、缓存数据：它的过时时间比缓存标记的时间延长1倍，例：标记缓存时间30分钟，数据缓存设置为60分钟。这样，当缓存标记key过时后，实际缓存还能把旧数据返回给调用端，直到另外的线程在后台更新完成后，才会返回新缓存。

关于缓存崩溃的解决方法，这里提出了三种方案：使用锁或队列、设置过时标志更新缓存、为key设置不一样的缓存失效时间，还有一各被称为“二级缓存”的解决方法，有兴趣的读者能够自行研究。

2、缓存穿透

缓存穿透是指用户查询数据，在数据库没有，天然在缓存中也不会有。这样就致使用户查询的时候，在缓存中找不到，每次都要去数据库再查询一遍，而后返回空（至关于进行了两次无用的查询）。这样请求就绕过缓存直接查数据库，这也是常常提的缓存命中率问题。

有不少种方法能够有效地解决缓存穿透问题，最多见的则是采用布隆过滤器，将全部可能存在的数据哈希到一个足够大的bitmap中，一个必定不存在的数据会被这个bitmap拦截掉，从而避免了对底层存储系统的查询压力。

另外也有一个更为简单粗暴的方法，若是一个查询返回的数据为空（无论是数据不存在，仍是系统故障），咱们仍然把这个空结果进行缓存，但它的过时时间会很短，最长不超过五分钟。经过这个直接设置的默认值存放到缓存，这样第二次到缓冲中获取就有值了，而不会继续访问数据库，这种办法最简单粗暴！

//伪代码 public object GetProductListNew() { int cacheTime = 30; String cacheKey = "product_list"; String cacheValue = CacheHelper.Get(cacheKey); if (cacheValue != null) { return cacheValue; } cacheValue = CacheHelper.Get(cacheKey); if (cacheValue != null) { return cacheValue; } else { //数据库查询不到，为空 cacheValue = GetProductListFromDB(); if (cacheValue == null) { //若是发现为空，设置个默认值，也缓存起来 cacheValue = string.Empty; } CacheHelper.Add(cacheKey, cacheValue, cacheTime); return cacheValue; } }

把空结果，也给缓存起来，这样下次一样的请求就能够直接返回空了，便可以免当查询的值为空时引发的缓存穿透。同时也能够单独设置个缓存区域存储空值，对要查询的key进行预先校验，而后再放行给后面的正常缓存处理逻辑。

3、缓存预热

缓存预热这个应该是一个比较常见的概念，相信不少小伙伴都应该能够很容易的理解，缓存预热就是系统上线后，将相关的缓存数据直接加载到缓存系统。这样就能够避免在用户请求的时候，先查询数据库，而后再将数据缓存的问题！用户直接查询事先被预热的缓存数据！

解决思路：

一、直接写个缓存刷新页面，上线时手工操做下；

二、数据量不大，能够在项目启动的时候自动进行加载；

三、定时刷新缓存；

4、缓存更新

除了缓存服务器自带的缓存失效策略以外（Redis默认的有6中策略可供选择），咱们还能够根据具体的业务需求进行自定义的缓存淘汰，常见的策略有两种：

（1）定时去清理过时的缓存；

（2）当有用户请求过来时，再判断这个请求所用到的缓存是否过时，过时的话就去底层系统获得新数据并更新缓存。

二者各有优劣，第一种的缺点是维护大量缓存的key是比较麻烦的，第二种的缺点就是每次用户请求过来都要判断缓存失效，逻辑相对比较复杂！具体用哪一种方案，你们能够根据本身的应用场景来权衡。

5、缓存降级

当访问量剧增、服务出现问题（如响应时间慢或不响应）或非核心服务影响到核心流程的性能时，仍然须要保证服务仍是可用的，即便是有损服务。系统能够根据一些关键数据进行自动降级，也能够配置开关实现人工降级。

降级的最终目的是保证核心服务可用，即便是有损的。并且有些服务是没法降级的（如加入购物车、结算）。

在进行降级以前要对系统进行梳理，看看系统是否是能够丢卒保帅；从而梳理出哪些必须誓死保护，哪些可降级；好比能够参考日志级别设置预案：

（1）通常：好比有些服务偶尔由于网络抖动或者服务正在上线而超时，能够自动降级；

（2）警告：有些服务在一段时间内成功率有波动（如在95~100%之间），能够自动降级或人工降级，并发送告警；

（3）错误：好比可用率低于90%，或者数据库链接池被打爆了，或者访问量忽然猛增到系统能承受的最大阀值，此时能够根据状况自动降级或者人工降级；

（4）严重错误：好比由于特殊缘由数据错误了，此时须要紧急人工降级。

6、总结

这些都是实际项目中，可能碰到的一些问题，也是面试的时候常常会被问到的知识点，实际上还有不少不少各类各样的问题，文中的解决方案，也不可能知足全部的场景，相对来讲只是对该问题的入门解决方法。通常正式的业务场景每每要复杂的多，应用场景不一样，方法和解决方案也不一样，因为上述方案，考虑的问题并非很全面，所以并不适用于正式的项目开发，可是能够做为概念理解入门，具体解决方案要根据实际状况来肯定！