这几道Redis面试题都不懂,offer确定与你擦肩而过面试
如何解决缓存雪崩?redis
如何解决缓存穿透?数据库
如何保证缓存与数据库双写时一致的问题?设计模式
1、缓存雪崩缓存
1.1什么是缓存雪崩?架构
回顾一下咱们为何要用缓存(Redis):并发
如今有个问题,若是咱们的缓存挂掉了,这意味着咱们的所有请求都跑去数据库了。分布式
在前面学习咱们都知道Redis不可能把全部的数据都缓存起来(内存昂贵且有限),因此Redis须要对数据设置过时时间,并采用的是惰性删除+按期删除两种策略对过时键删除。ide
若是缓存数据设置的过时时间是相同的,而且Redis刚好将这部分数据所有删光了。这就会致使在这段时间内,这些缓存同时失效,所有请求到数据库中。高并发
这就是缓存雪崩:
Redis挂掉了,请求所有走数据库。
对缓存数据设置相同的过时时间,致使某段时间内缓存失效,请求所有走数据库。
缓存雪崩若是发生了,极可能就把咱们的数据库搞垮,致使整个服务瘫痪!
1.2如何解决缓存雪崩?
对于“对缓存数据设置相同的过时时间,致使某段时间内缓存失效,请求所有走数据库。”这种状况,很是好解决:
解决方法:在缓存的时候给过时时间加上一个随机值,这样就会大幅度的减小缓存在同一时间过时。
对于“Redis挂掉了,请求所有走数据库”这种状况,咱们能够有如下的思路:
事发前:实现Redis的高可用(主从架构+Sentinel 或者Redis Cluster),尽可能避免Redis挂掉这种状况发生。
事发中:万一Redis真的挂了,咱们能够设置本地缓存(ehcache)+限流(hystrix),尽可能避免咱们的数据库被干掉(起码能保证咱们的服务仍是能正常工做的)
事发后:redis持久化,重启后自动从磁盘上加载数据,快速恢复缓存数据。
**2、缓存穿透
2.1什么是缓存穿透?**
好比,咱们有一张数据库表,ID都是从1开始的(正数):
可是可能有黑客想把个人数据库搞垮,每次请求的ID都是负数。这会致使个人缓存就没用了,请求所有都找数据库去了,但数据库也没有这个值啊,因此每次都返回空出去。
缓存穿透是指查询一个必定不存在的数据。因为缓存不命中,而且出于容错考虑,若是从数据库查不到数据则不写入缓存,这将致使这个不存在的数据每次请求都要到数据库去查询,失去了缓存的意义。
这就是缓存穿透:
请求的数据在缓存大量不命中,致使请求走数据库。
缓存穿透若是发生了,也可能把咱们的数据库搞垮,致使整个服务瘫痪!
2.1如何解决缓存穿透?
解决缓存穿透也有两种方案:
因为请求的参数是不合法的(每次都请求不存在的参数),因而咱们可使用布隆过滤器(BloomFilter)或者压缩filter提早拦截,不合法就不让这个请求到数据库层!
当咱们从数据库找不到的时候,咱们也将这个空对象设置到缓存里边去。下次再请求的时候,就能够从缓存里边获取了。
这种状况咱们通常会将空对象设置一个较短的过时时间。
3、缓存与数据库双写一致
3.1对于读操做,流程是这样的
上面讲缓存穿透的时候也提到了:若是从数据库查不到数据则不写入缓存。
通常咱们对读操做的时候有这么一个固定的套路:
若是咱们的数据在缓存里边有,那么就直接取缓存的。
若是缓存里没有咱们想要的数据,咱们会先去查询数据库,而后将数据库查出来的数据写到缓存中。
最后将数据返回给请求
3.2什么是缓存与数据库双写一致问题?
若是仅仅查询的话,缓存的数据和数据库的数据是没问题的。可是,当咱们要更新时候呢?各类状况极可能就形成数据库和缓存的数据不一致了。
这里不一致指的是:数据库的数据跟缓存的数据不一致
从理论上说,只要咱们设置了键的过时时间,咱们就能保证缓存和数据库的数据最终是一致的。由于只要缓存数据过时了,就会被删除。随后读的时候,由于缓存里没有,就能够查数据库的数据,而后将数据库查出来的数据写入到缓存中。
除了设置过时时间,咱们还须要作更多的措施来尽可能避免数据库与缓存处于不一致的状况发生。
3.3对于更新操做
通常来讲,执行更新操做时,咱们会有两种选择:
先操做数据库,再操做缓存
先操做缓存,再操做数据库
首先,要明确的是,不管咱们选择哪一个,咱们都但愿这两个操做要么同时成功,要么同时失败。因此,这会演变成一个分布式事务的问题。
因此,若是原子性被破坏了,可能会有如下的状况:
操做数据库成功了,操做缓存失败了。
操做缓存成功了,操做数据库失败了。
若是第一步已经失败了,咱们直接返回Exception出去就行了,第二步根本不会执行。
下面咱们具体来分析一下吧。
3.3.1操做缓存
操做缓存也有两种方案:
更新缓存
删除缓存
通常咱们都是采起删除缓存缓存策略的,缘由以下:
高并发环境下,不管是先操做数据库仍是后操做数据库而言,若是加上更新缓存,那就更加容易致使数据库与缓存数据不一致问题。(删除缓存直接和简单不少)
若是每次更新了数据库,都要更新缓存【这里指的是频繁更新的场景,这会耗费必定的性能】,倒不如直接删除掉。等再次读取时,缓存里没有,那我到数据库找,在数据库找到再写到缓存里边(体现懒加载)
基于这两点,对于缓存在更新时而言,都是建议执行删除操做!
3.3.2先更新数据库,再删除缓存
正常的状况是这样的:
先操做数据库,成功;
再删除缓存,也成功;
若是原子性被破坏了:
第一步成功(操做数据库),第二步失败(删除缓存),会致使数据库里是新数据,而缓存里是旧数据。
若是第一步(操做数据库)就失败了,咱们能够直接返回错误(Exception),不会出现数据不一致。
若是在高并发的场景下,出现数据库与缓存数据不一致的几率特别低,也不是没有:
缓存恰好失效
线程A查询数据库,得一个旧值
线程B将新值写入数据库
线程B删除缓存
线程A将查到的旧值写入缓存
要达成上述状况,仍是说一句几率特别低:
由于这个条件须要发生在读缓存时缓存失效,并且并发着有一个写操做。而实际上数据库的写操做会比读操做慢得多,并且还要锁表,而读操做必需在写操做前进入数据库操做,而又要晚于写操做更新缓存,全部的这些条件都具有的几率基本并不大。
对于这种策略,实际上是一种设计模式:Cache Aside Pattern
删除缓存失败的解决思路:
将须要删除的key发送到消息队列中
本身消费消息,得到须要删除的key
不断重试删除操做,直到成功
3.3.3先删除缓存,再更新数据库
正常状况是这样的:
先删除缓存,成功;
再更新数据库,也成功;
若是原子性被破坏了:
第一步成功(删除缓存),第二步失败(更新数据库),数据库和缓存的数据仍是一致的。
若是第一步(删除缓存)就失败了,咱们能够直接返回错误(Exception),数据库和缓存的数据仍是一致的。
看起来是很美好,可是咱们在并发场景下分析一下,就知道仍是有问题的了:
线程A删除了缓存
线程B查询,发现缓存已不存在
线程B去数据库查询获得旧值
线程B将旧值写入缓存
线程A将新值写入数据库
因此也会致使数据库和缓存不一致的问题。
并发下解决数据库与缓存不一致的思路:
将删除缓存、修改数据库、读取缓存等的操做积压到队列里边,实现串行化。
3.4对比两种策略
咱们能够发现,两种策略各自有优缺点:
先删除缓存,再更新数据库
在高并发下表现不如意,在原子性被破坏时表现优异
先更新数据库,再删除缓存(Cache Aside Pattern设计模式)
在高并发下表现优异,在原子性被破坏时表现不如意
3.5其余保障数据一致的方案与资料
能够用databus或者阿里的canal监听binlog进行更新。
最后
这是几道Redis常见的面试题,但愿你们看完有所帮助,顺利拿到offer!