Redis(Remote Dictionary Server) 是一个使用 C 语言编写的,开源的(BSD许可)高性能非关系型(NoSQL)的键值对数据库。前端
Redis 能够存储键和五种不一样类型的值之间的映射。键的类型只能为字符串,值支持五种数据类型:字符串、列表、集合、散列表、有序集合。node
与传统数据库不一样的是 Redis 的数据是存在内存中的,因此读写速度很是快,所以 redis 被普遍应用于缓存方向,每秒能够处理超过 10万次读写操做,是已知性能最快的Key-Value DB。另外,Redis 也常常用来作分布式锁。除此以外,Redis 支持事务 、持久化、LUA脚本、LRU驱动事件、多种集群方案。web
优势面试
缺点redis
主要从“高性能”和“高并发”这两点来看待这个问题。算法
高性能:数据库
假如用户第一次访问数据库中的某些数据。这个过程会比较慢,由于是从硬盘上读取的。将该用户访问的数据存在数缓存中,这样下一次再访问这些数据的时候就能够直接从缓存中获取了。操做缓存就是直接操做内存,因此速度至关快。若是数据库中的对应数据改变的以后,同步改变缓存中相应的数据便可!编程
高并发:windows
直接操做缓存可以承受的请求是远远大于直接访问数据库的,因此咱们能够考虑把数据库中的部分数据转移到缓存中去,这样用户的一部分请求会直接到缓存这里而不用通过数据库。
缓存分为本地缓存和分布式缓存。以 Java 为例,使用自带的 map 或者 guava 实现的是本地缓存,最主要的特色是轻量以及快速,生命周期随着 jvm 的销毁而结束,而且在多实例的状况下,每一个实例都须要各自保存一份缓存,缓存不具备一致性。
使用 redis 或 memcached 之类的称为分布式缓存,在多实例的状况下,各实例共用一份缓存数据,缓存具备一致性。缺点是须要保持 redis 或 memcached服务的高可用,整个程序架构上较为复杂。
一、彻底基于内存,绝大部分请求是纯粹的内存操做,很是快速。数据存在内存中,相似于 HashMap,HashMap 的优点就是查找和操做的时间复杂度都是O(1);
二、数据结构简单,对数据操做也简单,Redis 中的数据结构是专门进行设计的;
三、采用单线程,避免了没必要要的上下文切换和竞争条件,也不存在多进程或者多线程致使的切换而消耗 CPU,不用去考虑各类锁的问题,不存在加锁释放锁操做,没有由于可能出现死锁而致使的性能消耗;
四、使用多路 I/O 复用模型,非阻塞 IO;
五、使用底层模型不一样,它们之间底层实现方式以及与客户端之间通讯的应用协议不同,Redis 直接本身构建了 VM 机制 ,由于通常的系统调用系统函数的话,会浪费必定的时间去移动和请求;
Redis主要有5种数据类型,包括String,List,Set,Zset,Hash,知足大部分的使用要求
数据类型 | 能够存储的值 | 操做 | 应用场景 |
---|---|---|---|
STRING | 字符串、整数或者浮点数 | 对整个字符串或者字符串的其中一部分执行操做 对整数和浮点数执行自增或者自减操做 |
作简单的键值对缓存 |
LIST | 列表 | 从两端压入或者弹出元素 对单个或者多个元素进行修剪, 只保留一个范围内的元素 |
存储一些列表型的数据结构,相似粉丝列表、文章的评论列表之类的数据 |
SET | 无序集合 | 添加、获取、移除单个元素 检查一个元素是否存在于集合中 计算交集、并集、差集 从集合里面随机获取元素 |
交集、并集、差集的操做,好比交集,能够把两我的的粉丝列表整一个交集 |
HASH | 包含键值对的无序散列表 | 添加、获取、移除单个键值对 获取全部键值对 检查某个键是否存在 |
结构化的数据,好比一个对象 |
ZSET | 有序集合 | 添加、获取、删除元素 根据分值范围或者成员来获取元素 计算一个键的排名 |
去重但能够排序,如获取排名前几名的用户 |
总结一
计数器
能够对 String 进行自增自减运算,从而实现计数器功能。Redis 这种内存型数据库的读写性能很是高,很适合存储频繁读写的计数量。
缓存
将热点数据放到内存中,设置内存的最大使用量以及淘汰策略来保证缓存的命中率。
会话缓存
能够使用 Redis 来统一存储多台应用服务器的会话信息。当应用服务器再也不存储用户的会话信息,也就再也不具备状态,一个用户能够请求任意一个应用服务器,从而更容易实现高可用性以及可伸缩性。
全页缓存(FPC)
除基本的会话token以外,Redis还提供很简便的FPC平台。以Magento为例,Magento提供一个插件来使用Redis做为全页缓存后端。此外,对WordPress的用户来讲,Pantheon有一个很是好的插件 wp-redis,这个插件能帮助你以最快速度加载你曾浏览过的页面。
查找表
例如 DNS 记录就很适合使用 Redis 进行存储。查找表和缓存相似,也是利用了 Redis 快速的查找特性。可是查找表的内容不能失效,而缓存的内容能够失效,由于缓存不做为可靠的数据来源。
消息队列(发布/订阅功能)
List 是一个双向链表,能够经过 lpush 和 rpop 写入和读取消息。不过最好使用 Kafka、RabbitMQ 等消息中间件。
分布式锁实现
在分布式场景下,没法使用单机环境下的锁来对多个节点上的进程进行同步。能够使用 Redis 自带的 SETNX 命令实现分布式锁,除此以外,还能够使用官方提供的 RedLock 分布式锁实现。
其它
Set 能够实现交集、并集等操做,从而实现共同好友等功能。ZSet 能够实现有序性操做,从而实现排行榜等功能。
总结二
Redis相比其余缓存,有一个很是大的优点,就是支持多种数据类型。
数据类型说明string字符串,最简单的k-v存储hashhash格式,value为field和value,适合ID-Detail这样的场景。list简单的list,顺序列表,支持首位或者末尾插入数据set无序list,查找速度快,适合交集、并集、差集处理sorted set有序的set
其实,经过上面的数据类型的特性,基本就能想到合适的应用场景了。
string——适合最简单的k-v存储,相似于memcached的存储结构,短信验证码,配置信息等,就用这种类型来存储。
hash——通常key为ID或者惟一标示,value对应的就是详情了。如商品详情,我的信息详情,新闻详情等。
list——由于list是有序的,比较适合存储一些有序且数据相对固定的数据。如省市区表、字典表等。由于list是有序的,适合根据写入的时间来排序,如:最新的***,消息队列等。
set——能够简单的理解为ID-List的模式,如微博中一我的有哪些好友,set最牛的地方在于,能够对两个set提供交集、并集、差集操做。例如:查找两我的共同的好友等。
Sorted Set——是set的加强版本,增长了一个score参数,自动会根据score的值进行排序。比较适合相似于top 10等不根据插入的时间来排序的数据。
如上所述,虽然Redis不像关系数据库那么复杂的数据结构,可是,也能适合不少场景,比通常的缓存数据结构要多。了解每种数据结构适合的业务场景,不只有利于提高开发效率,也能有效利用Redis的性能。
持久化就是把内存的数据写到磁盘中去,防止服务宕机了内存数据丢失。
Redis 提供两种持久化机制 RDB(默认) 和 AOF 机制:
RDB:是Redis DataBase缩写快照
RDB是Redis默认的持久化方式。按照必定的时间将内存的数据以快照的形式保存到硬盘中,对应产生的数据文件为dump.rdb。经过配置文件中的save参数来定义快照的周期。
优势:
缺点:
AOF:持久化
AOF持久化(即Append Only File持久化),则是将Redis执行的每次写命令记录到单独的日志文件中,当重启Redis会从新将持久化的日志中文件恢复数据。
当两种方式同时开启时,数据恢复Redis会优先选择AOF恢复。
优势:
缺点:
优缺点是什么?
通常来讲, 若是想达到足以媲美PostgreSQL的数据安全性,你应该同时使用两种持久化功能。在这种状况下,当 Redis 重启的时候会优先载入AOF文件来恢复原始的数据,由于在一般状况下AOF文件保存的数据集要比RDB文件保存的数据集要完整。
若是你很是关心你的数据, 但仍然能够承受数分钟之内的数据丢失,那么你能够只使用RDB持久化。
有不少用户都只使用AOF持久化,但并不推荐这种方式,由于定时生成RDB快照(snapshot)很是便于进行数据库备份, 而且 RDB 恢复数据集的速度也要比AOF恢复的速度要快,除此以外,使用RDB还能够避免AOF程序的bug。
若是你只但愿你的数据在服务器运行的时候存在,你也能够不使用任何持久化方式。
若是Redis被当作缓存使用,使用一致性哈希实现动态扩容缩容。
若是Redis被当作一个持久化存储使用,必须使用固定的keys-to-nodes映射关系,节点的数量一旦肯定不能变化。不然的话(即Redis节点须要动态变化的状况),必须使用能够在运行时进行数据再平衡的一套系统,而当前只有Redis集群能够作到这样。
咱们都知道,Redis是key-value数据库,咱们能够设置Redis中缓存的key的过时时间。Redis的过时策略就是指当Redis中缓存的key过时了,Redis如何处理。
过时策略一般有如下三种:
Redis中同时使用了惰性过时和按期过时两种过时策略。
EXPIRE和PERSIST命令。
除了缓存服务器自带的缓存失效策略以外(Redis默认的有6中策略可供选择),咱们还能够根据具体的业务需求进行自定义的缓存淘汰,常见的策略有两种:
定时去清理过时的缓存;
当有用户请求过来时,再判断这个请求所用到的缓存是否过时,过时的话就去底层系统获得新数据并更新缓存。
二者各有优劣,第一种的缺点是维护大量缓存的key是比较麻烦的,第二种的缺点就是每次用户请求过来都要判断缓存失效,逻辑相对比较复杂!具体用哪一种方案,你们能够根据本身的应用场景来权衡。
redis内存数据集大小上升到必定大小的时候,就会施行数据淘汰策略。
Redis的内存淘汰策略是指在Redis的用于缓存的内存不足时,怎么处理须要新写入且须要申请额外空间的数据。
全局的键空间选择性移除
设置过时时间的键空间选择性移除
总结
Redis的内存淘汰策略的选取并不会影响过时的key的处理。内存淘汰策略用于处理内存不足时的须要申请额外空间的数据;过时策略用于处理过时的缓存数据。
内存。
若是达到设置的上限,Redis的写命令会返回错误信息(可是读命令还能够正常返回。)或者你能够配置内存淘汰机制,当Redis达到内存上限时会冲刷掉旧的内容。
能够好好利用Hash,list,sorted set,set等集合类型数据,由于一般状况下不少小的Key-Value能够用更紧凑的方式存放到一块儿。尽量使用散列表(hashes),散列表(是说散列表里面存储的数少)使用的内存很是小,因此你应该尽量的将你的数据模型抽象到一个散列表里面。好比你的web系统中有一个用户对象,不要为这个用户的名称,姓氏,邮箱,密码设置单独的key,而是应该把这个用户的全部信息存储到一张散列表里面
Redis基于Reactor模式开发了网络事件处理器,这个处理器被称为文件事件处理器(file event handler)。它的组成结构为4部分:多个套接字、IO多路复用程序、文件事件分派器、事件处理器。由于文件事件分派器队列的消费是单线程的,因此Redis才叫单线程模型。
虽然文件事件处理器以单线程方式运行, 但经过使用 I/O 多路复用程序来监听多个套接字, 文件事件处理器既实现了高性能的网络通讯模型, 又能够很好地与 redis 服务器中其余一样以单线程方式运行的模块进行对接, 这保持了 Redis 内部单线程设计的简单性。
参考:http://www.javashuo.com/article/p-otjatuie-de.html
事务是一个单独的隔离操做:事务中的全部命令都会序列化、按顺序地执行。事务在执行的过程当中,不会被其余客户端发送来的命令请求所打断。
事务是一个原子操做:事务中的命令要么所有被执行,要么所有都不执行。
Redis 事务的本质是经过MULTI、EXEC、WATCH等一组命令的集合。事务支持一次执行多个命令,一个事务中全部命令都会被序列化。在事务执行过程,会按照顺序串行化执行队列中的命令,其余客户端提交的命令请求不会插入到事务执行命令序列中。
总结说:redis事务就是一次性、顺序性、排他性的执行一个队列中的一系列命令。
事务执行过程当中,若是服务端收到有EXEC、DISCARD、WATCH、MULTI以外的请求,将会把请求放入队列中排队
Redis事务功能是经过MULTI、EXEC、DISCARD和WATCH 四个原语实现的
Redis会将一个事务中的全部命令序列化,而后按顺序执行。
原子性(Atomicity)
原子性是指事务是一个不可分割的工做单位,事务中的操做要么都发生,要么都不发生。
一致性(Consistency)
事务先后数据的完整性必须保持一致。
隔离性(Isolation)
多个事务并发执行时,一个事务的执行不该影响其余事务的执行
持久性(Durability)
持久性是指一个事务一旦被提交,它对数据库中数据的改变就是永久性的,接下来即便数据库发生故障也不该该对其有任何影响
Redis的事务老是具备ACID中的一致性和隔离性,其余特性是不支持的。当服务器运行在AOF持久化模式下,而且appendfsync选项的值为always时,事务也具备耐久性。
Redis 是单进程程序,而且它保证在执行事务时,不会对事务进行中断,事务能够运行直到执行完全部事务队列中的命令为止。所以,Redis 的事务是老是带有隔离性的。
Redis中,单条命令是原子性执行的,但事务不保证原子性,且没有回滚。事务中任意命令执行失败,其他的命令仍会被执行。
哨兵的介绍
sentinel,中文名是哨兵。哨兵是 redis 集群机构中很是重要的一个组件,主要有如下功能:
哨兵用于实现 redis 集群的高可用,自己也是分布式的,做为一个哨兵集群去运行,互相协同工做。
哨兵的核心知识
redis 集群模式的工做原理能说一下么?在集群模式下,redis 的 key 是如何寻址的?分布式寻址都有哪些算法?了解一致性 hash 算法吗?
简介
Redis Cluster是一种服务端Sharding技术,3.0版本开始正式提供。Redis Cluster并无使用一致性hash,而是采用slot(槽)的概念,一共分红16384个槽。将请求发送到任意节点,接收到请求的节点会将查询请求发送到正确的节点上执行
方案说明
在 redis cluster 架构下,每一个 redis 要放开两个端口号,好比一个是 6379,另一个就是 加1w 的端口号,好比 16379。
16379 端口号是用来进行节点间通讯的,也就是 cluster bus 的东西,cluster bus 的通讯,用来进行故障检测、配置更新、故障转移受权。cluster bus 用了另一种二进制的协议,gossip
协议,用于节点间进行高效的数据交换,占用更少的网络带宽和处理时间。
节点间的内部通讯机制
基本通讯原理
集群元数据的维护有两种方式:集中式、Gossip 协议。redis cluster 节点间采用 gossip 协议进行通讯。
分布式寻址算法
优势
缺点
简介
Redis Sharding是Redis Cluster出来以前,业界广泛使用的多Redis实例集群方法。其主要思想是采用哈希算法将Redis数据的key进行散列,经过hash函数,特定的key会映射到特定的Redis节点上。Java redis客户端驱动jedis,支持Redis Sharding功能,即ShardedJedis以及结合缓存池的ShardedJedisPool
优势
优点在于很是简单,服务端的Redis实例彼此独立,相互无关联,每一个Redis实例像单服务器同样运行,很是容易线性扩展,系统的灵活性很强
缺点
简介
客户端发送请求到一个代理组件,代理解析客户端的数据,并将请求转发至正确的节点,最后将结果回复给客户端
特征
业界开源方案
单机的 redis,可以承载的 QPS 大概就在上万到几万不等。对于缓存来讲,通常都是用来支撑读高并发的。所以架构作成主从(master-slave)架构,一主多从,主负责写,而且将数据复制到其它的 slave 节点,从节点负责读。全部的读请求所有走从节点。这样也能够很轻松实现水平扩容,支撑读高并发。
redis replication -> 主从架构 -> 读写分离 -> 水平扩容支撑读高并发
redis replication 的核心机制
注意,若是采用了主从架构,那么建议必须开启 master node 的持久化,不建议用 slave node 做为 master node 的数据热备,由于那样的话,若是你关掉 master 的持久化,可能在 master 宕机重启的时候数据是空的,而后可能一通过复制, slave node 的数据也丢了。
另外,master 的各类备份方案,也须要作。万一本地的全部文件丢失了,从备份中挑选一份 rdb 去恢复 master,这样才能确保启动的时候,是有数据的,即便采用了后续讲解的高可用机制,slave node 能够自动接管 master node,但也可能 sentinel 还没检测到 master failure,master node 就自动重启了,仍是可能致使上面全部的 slave node 数据被清空。
redis 主从复制的核心原理
当启动一个 slave node 的时候,它会发送一个 PSYNC
命令给 master node。
若是这是 slave node 初次链接到 master node,那么会触发一次 full resynchronization
全量复制。此时 master 会启动一个后台线程,开始生成一份 RDB
快照文件,
同时还会将从客户端 client 新收到的全部写命令缓存在内存中。RDB
文件生成完毕后, master 会将这个 RDB
发送给 slave,slave 会先写入本地磁盘,而后再从本地磁盘加载到内存中,
接着 master 会将内存中缓存的写命令发送到 slave,slave 也会同步这些数据。
slave node 若是跟 master node 有网络故障,断开了链接,会自动重连,链接以后 master node 仅会复制给 slave 部分缺乏的数据。
过程原理
缺点
全部的slave节点数据的复制和同步都由master节点来处理,会照成master节点压力太大,使用主从从结构来解决
为了使在部分节点失败或者大部分节点没法通讯的状况下集群仍然可用,因此集群使用了主从复制模型,每一个节点都会有N-1个复制品
redis cluster,10 台机器,5 台机器部署了 redis 主实例,另外 5 台机器部署了 redis 的从实例,每一个主实例挂了一个从实例,5 个节点对外提供读写服务,每一个节点的读写高峰qps可能能够达到每秒 5 万,5 台机器最可能是 25 万读写请求/s。
机器是什么配置?32G 内存+ 8 核 CPU + 1T 磁盘,可是分配给 redis 进程的是10g内存,通常线上生产环境,redis 的内存尽可能不要超过 10g,超过 10g 可能会有问题。
5 台机器对外提供读写,一共有 50g 内存。
由于每一个主实例都挂了一个从实例,因此是高可用的,任何一个主实例宕机,都会自动故障迁移,redis 从实例会自动变成主实例继续提供读写服务。
你往内存里写的是什么数据?每条数据的大小是多少?商品数据,每条数据是 10kb。100 条数据是 1mb,10 万条数据是 1g。常驻内存的是 200 万条商品数据,占用内存是 20g,仅仅不到总内存的 50%。目前高峰期每秒就是 3500 左右的请求量。
其实大型的公司,会有基础架构的 team 负责缓存集群的运维。
Redis集群没有使用一致性hash,而是引入了哈希槽的概念,Redis集群有16384个哈希槽,每一个key经过CRC16校验后对16384取模来决定放置哪一个槽,集群的每一个节点负责一部分hash槽。
Redis并不能保证数据的强一致性,这意味这在实际中集群在特定的条件下可能会丢失写操做。
异步复制
16384个
Redis集群目前没法作数据库选择,默认在0数据库。
能够在同一个服务器部署多个Redis的实例,并把他们看成不一样的服务器来使用,在某些时候,不管如何一个服务器是不够的, 因此,若是你想使用多个CPU,你能够考虑一下分片(shard)。
分区可让Redis管理更大的内存,Redis将能够使用全部机器的内存。若是没有分区,你最多只能使用一台机器的内存。分区使Redis的计算能力经过简单地增长计算机获得成倍提高,Redis的网络带宽也会随着计算机和网卡的增长而成倍增加。
Redis为单进程单线程模式,采用队列模式将并发访问变成串行访问,且多客户端对Redis的链接并不存在竞争关系Redis中能够使用SETNX命令实现分布式锁。
当且仅当 key 不存在,将 key 的值设为 value。 若给定的 key 已经存在,则 SETNX 不作任何动做
SETNX 是『SET if Not eXists』(若是不存在,则 SET)的简写。
返回值:设置成功,返回 1 。设置失败,返回 0 。
使用SETNX完成同步锁的流程及事项以下:
使用SETNX命令获取锁,若返回0(key已存在,锁已存在)则获取失败,反之获取成功
为了防止获取锁后程序出现异常,致使其余线程/进程调用SETNX命令老是返回0而进入死锁状态,须要为该key设置一个“合理”的过时时间
释放锁,使用DEL命令将锁数据删除
所谓 Redis 的并发竞争 Key 的问题也就是多个系统同时对一个 key 进行操做,可是最后执行的顺序和咱们指望的顺序不一样,这样也就致使告终果的不一样!
推荐一种方案:分布式锁(zookeeper 和 redis 均可以实现分布式锁)。(若是不存在 Redis 的并发竞争 Key 问题,不要使用分布式锁,这样会影响性能)
基于zookeeper临时有序节点能够实现的分布式锁。大体思想为:每一个客户端对某个方法加锁时,在zookeeper上的与该方法对应的指定节点的目录下,生成一个惟一的瞬时有序节点。 判断是否获取锁的方式很简单,只须要判断有序节点中序号最小的一个。 当释放锁的时候,只需将这个瞬时节点删除便可。同时,其能够避免服务宕机致使的锁没法释放,而产生的死锁问题。完成业务流程后,删除对应的子节点释放锁。
在实践中,固然是从以可靠性为主。因此首推Zookeeper。
参考:https://www.jianshu.com/p/8bddd381de06
既然Redis是如此的轻量(单实例只使用1M内存),为防止之后的扩容,最好的办法就是一开始就启动较多实例。即使你只有一台服务器,你也能够一开始就让Redis以分布式的方式运行,使用分区,在同一台服务器上启动多个实例。
一开始就多设置几个Redis实例,例如32或者64个实例,对大多数用户来讲这操做起来可能比较麻烦,可是从长久来看作这点牺牲是值得的。
这样的话,当你的数据不断增加,须要更多的Redis服务器时,你须要作的就是仅仅将Redis实例从一台服务迁移到另一台服务器而已(而不用考虑从新分区的问题)。一旦你添加了另外一台服务器,你须要将你一半的Redis实例从第一台机器迁移到第二台机器。
Redis 官方站提出了一种权威的基于 Redis 实现分布式锁的方式名叫 Redlock,此种方式比原先的单节点的方法更安全。它能够保证如下特性:
缓存雪崩是指缓存同一时间大面积的失效,因此,后面的请求都会落到数据库上,形成数据库短期内承受大量请求而崩掉。
解决方案
缓存穿透是指缓存和数据库中都没有的数据,致使全部的请求都落到数据库上,形成数据库短期内承受大量请求而崩掉。
解决方案
附加
对于空间的利用到达了一种极致,那就是Bitmap和布隆过滤器(Bloom Filter)。
Bitmap: 典型的就是哈希表
缺点是,Bitmap对于每一个元素只能记录1bit信息,若是还想完成额外的功能,恐怕只能靠牺牲更多的空间、时间来完成了。
布隆过滤器(推荐)
就是引入了k(k>1)k(k>1)个相互独立的哈希函数,保证在给定的空间、误判率下,完成元素判重的过程。
它的优势是空间效率和查询时间都远远超过通常的算法,缺点是有必定的误识别率和删除困难。
Bloom-Filter算法的核心思想就是利用多个不一样的Hash函数来解决“冲突”。
Hash存在一个冲突(碰撞)的问题,用同一个Hash获得的两个URL的值有可能相同。为了减小冲突,咱们能够多引入几个Hash,若是经过其中的一个Hash值咱们得出某元素不在集合中,那么该元素确定不在集合中。只有在全部的Hash函数告诉咱们该元素在集合中时,才能肯定该元素存在于集合中。这即是Bloom-Filter的基本思想。
Bloom-Filter通常用于在大数据量的集合中断定某元素是否存在。
缓存击穿是指缓存中没有但数据库中有的数据(通常是缓存时间到期),这时因为并发用户特别多,同时读缓存没读到数据,又同时去数据库去取数据,引发数据库压力瞬间增大,形成过大压力。和缓存雪崩不一样的是,缓存击穿指并发查同一条数据,缓存雪崩是不一样数据都过时了,不少数据都查不到从而查数据库。
解决方案
缓存预热就是系统上线后,将相关的缓存数据直接加载到缓存系统。这样就能够避免在用户请求的时候,先查询数据库,而后再将数据缓存的问题!用户直接查询事先被预热的缓存数据!
解决方案
直接写个缓存刷新页面,上线时手工操做一下;
数据量不大,能够在项目启动的时候自动进行加载;
定时刷新缓存;
当访问量剧增、服务出现问题(如响应时间慢或不响应)或非核心服务影响到核心流程的性能时,仍然须要保证服务仍是可用的,即便是有损服务。系统能够根据一些关键数据进行自动降级,也能够配置开关实现人工降级。
缓存降级的最终目的是保证核心服务可用,即便是有损的。并且有些服务是没法降级的(如加入购物车、结算)。
在进行降级以前要对系统进行梳理,看看系统是否是能够丢卒保帅;从而梳理出哪些必须誓死保护,哪些可降级;好比能够参考日志级别设置预案:
通常:好比有些服务偶尔由于网络抖动或者服务正在上线而超时,能够自动降级;
警告:有些服务在一段时间内成功率有波动(如在95~100%之间),能够自动降级或人工降级,并发送告警;
错误:好比可用率低于90%,或者数据库链接池被打爆了,或者访问量忽然猛增到系统能承受的最大阀值,此时能够根据状况自动降级或者人工降级;
严重错误:好比由于特殊缘由数据错误了,此时须要紧急人工降级。
服务降级的目的,是为了防止Redis服务故障,致使数据库跟着一块儿发生雪崩问题。所以,对于不重要的缓存数据,能够采起服务降级策略,例如一个比较常见的作法就是,Redis出现问题,不去数据库查询,而是直接返回默认值给用户。
热点数据,缓存才有价值
对于冷数据而言,大部分数据可能尚未再次访问到就已经被挤出内存,不只占用内存,并且价值不大。频繁修改的数据,看状况考虑使用缓存
对于热点数据,好比咱们的某IM产品,生日祝福模块,当天的寿星列表,缓存之后可能读取数十万次。再举个例子,某导航产品,咱们将导航信息,缓存之后可能读取数百万次。
数据更新前至少读取两次,缓存才有意义。这个是最基本的策略,若是缓存尚未起做用就失效了,那就没有太大价值了。
那存不存在,修改频率很高,可是又不得不考虑缓存的场景呢?有!好比,这个读取接口对数据库的压力很大,可是又是热点数据,这个时候就须要考虑经过缓存手段,减小数据库的压力,好比咱们的某助手产品的,点赞数,收藏数,分享数等是很是典型的热点数据,可是又不断变化,此时就须要将数据同步保存到Redis缓存,减小数据库压力。
缓存中的一个Key(好比一个促销商品),在某个时间点过时的时候,刚好在这个时间点对这个Key有大量的并发请求过来,这些请求发现缓存过时通常都会从后端DB加载数据并回设到缓存,这个时候大并发的请求可能会瞬间把后端DB压垮。
解决方案
对缓存查询加锁,若是KEY不存在,就加锁,而后查DB入缓存,而后解锁;其余进程若是发现有锁就等待,而后等解锁后返回数据或者进入DB查询
Redisson、Jedis、lettuce等等,官方推荐使用Redisson。
Redisson是一个高级的分布式协调Redis客服端,能帮助用户在分布式环境中轻松实现一些Java的对象 (Bloom filter, BitSet, Set, SetMultimap, ScoredSortedSet, SortedSet, Map, ConcurrentMap, List, ListMultimap, Queue, BlockingQueue, Deque, BlockingDeque, Semaphore, Lock, ReadWriteLock, AtomicLong, CountDownLatch, Publish / Subscribe, HyperLogLog)。
Jedis是Redis的Java实现的客户端,其API提供了比较全面的Redis命令的支持;Redisson实现了分布式和可扩展的Java数据结构,和Jedis相比,功能较为简单,不支持字符串操做,不支持排序、事务、管道、分区等Redis特性。Redisson的宗旨是促进使用者对Redis的关注分离,从而让使用者可以将精力更集中地放在处理业务逻辑上。
二者都是非关系型内存键值数据库,如今公司通常都是用 Redis 来实现缓存,并且 Redis 自身也愈来愈强大了!Redis 与 Memcached 主要有如下不一样:
对比参数 | Redis | Memcached |
---|---|---|
类型 | 1. 支持内存 2. 非关系型数据库 | 1. 支持内存 2. 键值对形式 3. 缓存形式 |
数据存储类型 | 1. String 2. List 3. Set 4. Hash 5. Sort Set 【俗称ZSet】 | 1. 文本型 2. 二进制类型 |
查询【操做】类型 | 1. 批量操做 2. 事务支持 3. 每一个类型不一样的CRUD | 1.经常使用的CRUD 2. 少许的其余命令 |
附加功能 | 1. 发布/订阅模式 2. 主从分区 3. 序列化支持 4. 脚本支持【Lua脚本】 | 1. 多线程服务支持 |
网络IO模型 | 1. 单线程的多路 IO 复用模型 | 1. 多线程,非阻塞IO模式 |
事件库 | 自封转简易事件库AeEvent | 贵族血统的LibEvent事件库 |
持久化支持 | 1. RDB 2. AOF | 不支持 |
集群模式 | 原生支持 cluster 模式,能够实现主从复制,读写分离 | 没有原生的集群模式,须要依靠客户端来实现往集群中分片写入数据 |
内存管理机制 | 在 Redis 中,并非全部数据都一直存储在内存中,能够将一些好久没用的 value 交换到磁盘 | Memcached 的数据则会一直在内存中,Memcached 将内存分割成特定长度的块来存储数据,以彻底解决内存碎片的问题。可是这种方式会使得内存的利用率不高,例如块的大小为 128 bytes,只存储 100 bytes 的数据,那么剩下的 28 bytes 就浪费掉了。 |
适用场景 | 复杂数据结构,有持久化,高可用需求,value存储内容较大 | 纯key-value,数据量很是大,并发量很是大的业务 |
(1) memcached全部的值均是简单的字符串,redis做为其替代者,支持更为丰富的数据类型
(2) redis的速度比memcached快不少
(3) redis能够持久化其数据
你只要用缓存,就可能会涉及到缓存与数据库双存储双写,你只要是双写,就必定会有数据一致性的问题,那么你如何解决一致性问题?
通常来讲,就是若是你的系统不是严格要求缓存+数据库必须一致性的话,缓存能够稍微的跟数据库偶尔有不一致的状况,最好不要作这个方案,读请求和写请求串行化,串到一个内存队列里去,这样就能够保证必定不会出现不一致的状况
串行化以后,就会致使系统的吞吐量会大幅度的下降,用比正常状况下多几倍的机器去支撑线上的一个请求。
还有一种方式就是可能会暂时产生不一致的状况,可是发生的概率特别小,就是先更新数据库,而后再删除缓存。
问题场景 | 描述 | 解决 |
---|---|---|
先写缓存,再写数据库,缓存写成功,数据库写失败 | 缓存写成功,但写数据库失败或者响应延迟,则下次读取(并发读)缓存时,就出现脏读 | 这个写缓存的方式,自己就是错误的,须要改成先写数据库,把旧缓存置为失效;读取数据的时候,若是缓存不存在,则读取数据库再写缓存 |
先写数据库,再写缓存,数据库写成功,缓存写失败 | 写数据库成功,但写缓存失败,则下次读取(并发读)缓存时,则读不到数据 | 缓存使用时,假如读缓存失败,先读数据库,再回写缓存的方式实现 |
须要缓存异步刷新 | 指数据库操做和写缓存不在一个操做步骤中,好比在分布式场景下,没法作到同时写缓存或须要异步刷新(补救措施)时候 | 肯定哪些数据适合此类场景,根据经验值肯定合理的数据不一致时间,用户数据刷新的时间间隔 |
由于目前Linux版本已经至关稳定,并且用户量很大,无需开发windows版本,反而会带来兼容性等问题。
512M
Redis2.6开始redis-cli支持一种新的被称之为pipe mode的新模式用于执行大量数据插入工做。
使用keys指令能够扫出指定模式的key列表。
对方接着追问:若是这个redis正在给线上的业务提供服务,那使用keys指令会有什么问题?
这个时候你要回答redis关键的一个特性:redis的单线程的。keys指令会致使线程阻塞一段时间,线上服务会停顿,直到指令执行完毕,服务才能恢复。这个时候能够使用scan指令,scan指令能够无阻塞的提取出指定模式的key列表,可是会有必定的重复几率,在客户端作一次去重就能够了,可是总体所花费的时间会比直接用keys指令长。
使用list类型保存数据信息,rpush生产消息,lpop消费消息,当lpop没有消息时,能够sleep一段时间,而后再检查有没有信息,若是不想sleep的话,能够使用blpop, 在没有信息的时候,会一直阻塞,直到信息的到来。redis能够经过pub/sub主题订阅模式实现一个生产者,多个消费者,固然也存在必定的缺点,当消费者下线时,生产的消息会丢失。
使用sortedset,使用时间戳作score, 消息内容做为key,调用zadd来生产消息,消费者使用zrangbyscore获取n秒以前的数据作轮询处理。
若是一个命令的结果致使大量内存被使用(例如很大的集合的交集保存到一个新的键),不用多久内存限制就会被这个内存使用量超越。
LRU算法