缓存的利于弊及应用场景
这里咱们主要讨论以Redis为表明的基于内存的缓存方案。redis
缓存的优势
- 提高访问速度,减小后端如数据库存储的时间消耗
- 减轻后端如数据库的压力
缓存带来的问题
任何系统每增长一个组件,在带来新的特性的同时也必然会带来额外的复杂度,能够说系统的设计过程就是一个折中的过程。缓存的引入也带来了一些须要考虑的问题:算法
- 数据不一致: 缓存层和存储层的数据存在着必定的时间窗口的不一致性,时间窗口跟缓存更新策略有关
- 代码维护成本: 须要同时处理缓存和存储层的逻辑
- 运维成本: 为了保证redis的可用性和并发性,会引入
redis sentinel
或redis cluster
等架构,这又增长了系统复杂性和运维难度。
应用场景
缓存更新策略
应用
- 低一致性业务建议:最大内存+淘汰策略
- 高一致性:超时剔除和主动更新
缓存穿透
缓存穿透: 是指查询一个根本不存在的数据, 缓存层和存储层都不会命中。这会形成存储层压力变大。数据库
缓存穿透的发现:
一般能够在程序中分别统计后端
若是发现大量存储层空命中, 可能就是出现了缓存穿透问题。缓存
缓存穿透的解决方案
- 缓存空对象
- 占用内存: 缘由是为了防止大量空对象(被攻击) 方案是能够设置比较短的过时时间,让其自动剔除
- 数据不一致: 缘由是存储层添加了数据,可是缓存空对象还没过时, 方案是可使用消息队列,
- bloomfilter拦截
- 这种方法适用于数据命中不高、 数据相对固定、 实时性低(一般是数据集较大) 的应用场景, 代码维护较为复杂,可是缓存空间占用少。
无底洞优化
因为缓存集群一般会将key进行hash,而后映射到相应的节点上,形成key的分布与业务无关,批量操做一般须要从不一样节点上获取,相比于单机批量操做只涉及一次网络操做,分布式批量操做会涉及屡次网络时间。网络
常见的IO优化思路:架构
- 命令自己的优化,例如优化SQL语句等
- 减小网络通讯次数
- 下降介入成本,例如客户端使用长连/链接池、NIO等
集群客户端优化方案并发
- 串行IO,把key的请求按照节点分组,而后依次处理
- 并行IO,把key的请求按照节点分组,而后并行处理
- hash_tag实现, 能够将多个key强制分配到一个节点上,它的操做时间=1此网络时间+n次命令时间,性能最高,可是数据维护成本高,数据易倾斜
雪崩优化
雪崩定义:因为缓存层承载着大量请求,有效地保存了存储层,可是若是缓存层因为某些缘由不能提供服务,因而全部的请求都会到达存储层,存储层的调用会暴增。运维
说到底就是缓存扛不住了,把压力冲击到了存储层。分布式
预防和缓解缓存雪崩问题的三个方面
- 保证缓存层服务高可用性,redis提供了
Redis Sentinel
和Redis Cluster
- 依赖隔离组件为后端限流并降级,降级机制,如
Hystrix
- 提早演练,项目上线前,演练缓存层宕掉后,应用及后端的负载状况以及可能出现的问题。
热点key重建优化
缓存+过时时间的策略既能够加速数据读写,又保证数据的按期更新,这种模式基本可以知足绝大部分需求。但有两个问题:
- 热点key,并发量很是大
- 重建缓存不能在短期完成(长时生成缓存)
热点key重建