string(字符串),hash(哈希),list(列表),set(集合)及zset(sorted set:有序集合)。前端
string类型是Redis最基本的数据类型,一个键最大能存储512MB。web
hash(map) 是一个键值对集合,特别适合用于存储对象。每一个 hash 能够存储 2的32 - 1次方 键值对(40多亿)。redis
list 列表是简单的字符串列表,按照插入顺序进行排序,能够添加一个元素导列表的头部(左边)或者尾部(右边)。算法
set 集合是string类型的无需集合,经过哈希表实现,添加,删除,查找的复杂度都是O(1)。若插入相同元素时,第二次的插入将被忽略。数据库
zset 有序集合,也是string类型元素的集合,且不容许重复的成员。vim
MemcacheDB是一个分布式、key-value形式的持久存储系统。它不是一个缓存组件,而是一个基于对象存取的、可靠的、快速的持久存储引擎后端
Redis的主要缺点是数据库容量受到物理内存的限制,不能用做海量数据的高性能读写,所以Redis适合的场景主要局限在较小数据量的高性能操做和运算上。数组
用redis实现分布式锁缓存
缓存算法: 安全
回收策略:
volatile-lru:从已设置过时时间的数据集中挑选最近最少使用的数据进行淘汰,Redis将回收那些超时的(仅仅是超时的)键值对,即:它只淘汰那些超时的键值对。
allkeys-lru:从数据集中挑选最近最少使用的数据进行淘汰,淘汰最近最少使用的key-value,Redis将对全部(不只仅是超时的)的键值对采用最近最少使用的淘汰策略。
volatile-lfu:淘汰最近最不经常使用的key-value,Redis将淘汰在必定时期内被访问次数最少的超时键值对。
allkeys-lfu:淘汰最近最不经常使用的key-value,Redis将对全部的键值对采用最近最不经常使用的淘汰策略。
volatile-random:从已设置过时时间的数据集中任意选择数据进行淘汰。采用随机淘汰策略删除超时的键值对。
allkeys-random:从数据集中任意选择数据进行淘汰。采用随机淘汰策略删除全部的键值对,这个策略不经常使用。
volatile-ttl:从已设置过时时间的数据集中挑选将要过时的数据进行淘汰。采用删除存活时间最短的键值对策略。
noeviction:禁止驱逐数据,不淘汰任何键值对。当内存达到限制的最大内存而且客户端还在继续执行会占用内存的命令时,会返回错误。当内存满时,若是进行读操做,例如get命令它将正常工做,而作写操做它将返回错误。即:当Redis采用这个策略内存达到最大的时候,它就只能读不能写了。
Redis默认采用noeviction策略。
通常的经验规则:
缓存雪崩:多是由于数据未加载到缓存中,或者在设置缓存采用了相同的过时时间,致使缓存在某一时刻同时大面积失效,从而致使全部请求都转发到数据库去查询,致使数据库CPU和内存负载太高,甚至宕机。
解决思路:
缓存穿透:是指查询一个必定不存在的数据,因为缓存是请求数据不命中时被动写入的,而且出于容错考虑,若是从存储层查不到数据则不写入缓存,这将致使这个不存在的数据每次请求都要到存储层去查询,在流量大时数据库可能就挂掉了,通俗说就是恶意用户模拟请求不少缓存中不存在的数据,因为缓存中都没有,致使这些请求短期内直接落在了数据库上,致使数据库异常。从系统层面来看像是穿透了缓存层直接达到db。
解决思路:
空值缓存:一种比较简单的解决办法,在第一次查询完不存在的数据后,将该key与对应的空值也放入缓存中,只不过设定为较短的失效时间,最长不超过五分钟。这样则能够应对短期的大量的该key攻击,设置为较短的失效时间是由于该值可能业务无关,存在乎义不大,且该次的查询也未必是攻击者发起,无太久存储的必要,故能够早点失效。
布隆过滤器(bloom filter):相似于哈希表的一种算法,将全部可能存在的数据哈希到一个足够大的bitmap中,在进行数据库查询以前会使用这个bitmap进行过滤,若是一个必定不存在的数据会被这个bitmap拦截掉,从而避免了对底层存储系统的查询压力。
缓存击穿:对于一些设置了过时时间的key,若是这些key在某些时间点被超高并发地访问,是一种很是“热点”的数据。这个时候可能会发生缓存被“击穿”的问题,和缓存雪崩的区别在于:缓存击穿是针对某一/几个key缓存,缓存雪崩则是不少key。当缓存在某个时间点过时的时候,刚好在这个时间点对这个Key有大量的并发请求过来,这些请求发现缓存过时通常都会从后端DB加载数据并回设到缓存,这个时候大并发的请求可能会瞬间把后端DB压垮。
好比:微博有一个热门话题的功能,用户对于热门话题的搜索量每每在一些时刻会大大的高于其余话题,这种咱们成为系统的“热点“,因为系统中对这些热点的数据缓存也存在失效时间,在热点的缓存到达失效时间时,此时可能依然会有大量的请求到达系统,没有了缓存层的保护,这些请求一样的会到达db从而可能引发故障。击穿与雪崩的区别即在于击穿是对于特定的热点数据来讲,而雪崩是所有数据。
解决思路:
缓存并发:若是网站并发访问高,一个缓存若是失效,可能出现多个进程同时查询DB,同时设置缓存的状况,若是并发确实很大,这也可能形成DB压力过大,还有缓存频繁更新的问题。
解决思路:对缓存查询加锁,若是KEY不存在,就加锁,而后查DB入缓存,而后解锁;其余进程若是发现有锁就等待,而后等解锁后返回数据或者进入DB查询。
缓存预热:目的就是在系统上线前,将数据加载到缓存中。
解决思路:数据量不大的话,在系统启动的时候直接加载。或者本身写个简单的缓存预热程序。
Redis 事务容许一组命令在单一步骤中执行。事务有两个特色:
MULTI:标记一个事务块的开始。
EXEC:执行全部事务块内的命令。
DISCARD:取消事务,放弃执行事务块内的全部命令。
WATCH key[key ...]:监视一个或多个key,若事务在执行这个key以前被其余命令所改动,那么事务将被打断。
UNWATCH:取消 WATCH 命令对全部 key 的监视。
举个栗子:
redis 127.0.0.1:6379> MULTI OK redis 127.0.0.1:6379> SET book-name "Mastering C++ in 21 days" QUEUED redis 127.0.0.1:6379> GET book-name QUEUED redis 127.0.0.1:6379> SADD tag "C++" "Programming" "Mastering Series" QUEUED redis 127.0.0.1:6379> SMEMBERS tag QUEUED redis 127.0.0.1:6379> EXEC 1) OK 2) "Mastering C++ in 21 days" 3) (integer) 3 4) 1) "Mastering Series" 2) "C++" 3) "Programming"
第一种方式(修改配置文件) Sudo vim /etc/redis/redis.conf 命令模式搜索requirepass,把注释掉的那行打开 # requirepass footbared requirepass 123456 第二种方式:直接在redis中设置,只对当前启动有效 设置密码:config set requirepass 123456 取消密码:config set requirepass “”
RDB (快照Snapshot)工做原理: 将databases中的key-value的二进制形式存储在了rdb文件中。先将数据存在内存,而后当数据累计达到某些设定的阀值的时候,就会触发一次DUMP操做,将变化的数据一次性写入数据文件(RDB文件)。
AOF 工做原理: 是将数据也是先存在内存,可是在存储的时候会使用调用fsync来完成对本次写操做的日志记录,这个日志揭露文件实际上是一个基于Redis网络交互协议的文本文件。AOF调用fsync也不是说所有都是无阻塞的,在某些系统上可能出现fsync阻塞进程的状况,对于这种状况能够经过配置修改,但默认状况不要修改。AOF最关键的配置就是关于调用fsync追加日志文件的平率,有两种预设频率,always每次记录进来都添加,everysecond 每秒添加一次。两个配置各有所长后面分析。因为是采用日志追加的方式来持久话数据,因此引出了第二个日志的概念:rewrite. 后面介绍它的由来。
性能:
RDB方式的性能明显高于AOF方式,RDB采用压缩的二进制方式存储数据,数据文件比较小,加载快速。存储的时候是按照配置项中的save策略来存储,每次都是聚合不少数据批量存储,写入的效率很好,而AOF则通常都是工做在实时存储或者准实时模式下。相对来讲存储的频率高,效率却偏低。
数据安全:
AOF数据安全性高于RDB存储,Snapshot存储是基于累计批量的思想,也就是在容许的状况下,累计的数据越多那么写入效率也就越高,但数据的累计是靠时间的积累完成的,那么若是在长时间数据不写入RDB,但Redis又遇到了崩溃,那么没有写入的数据就没法恢复了,可是AOF方式恰恰相反,根据AOF配置的存储频率的策略能够作到最少的数据丢失和较高的数据恢复能力。
1).Master写内存快照,save命令调度rdbSave函数,会阻塞主线程的工做,当快照比较大时对性能影响是很是大的,会间断性暂停服务,因此Master最好不要保存写内存快照。
2).Master AOF持久化,若是不重写AOF文件,这个持久化方式对性能的影响是最小的,可是AOF文件会不断增大,AOF文件过大会影响Master重启的恢复速度。Master最好不要作任何持久化工做,包括内存快照和AOF日志文件,特别是不要启用内存快照作持久化,若是数据比较关键,可以使用某个Slave开启AOF备份数据,策略为每秒同步一次。
3).Master调用 BGREWRITEAOF 重写AOF文件,AOF在重写的时候会占大量的CPU和内存资源,致使服务load太高,出现短暂服务暂停现象。
4).Redis主从复制的性能问题,为了主从复制的速度和链接的稳定性,Slave和Master最好在同一个局域网内
(1)会话缓存(Session Cache)最常使用,优点在于:Redis提供持久化。好比用户的购物车数据。
(2)全页缓存(FPC)
(3)队列 ,Reids提供的 list 和 set 操做,这使得Redis能做为一个很好的消息队列平台来使用。Redis做为队列使用的操做,相似于Python当中对 list 的 push/pop 操做。
(4)排行榜/计数器
缺点:
Redis 的主从复制采用全量复制,复制过程当中主机会 fork出一个子进程对内存作一份快照,并将子进程的内存快照保存为文件发送给从机,这一过程须要确保主机有足够多的空余内存。若快照文件较大,对集群的服务能力会产生较大的影响,并且复制过程是在从机新加入集群或者从机和主机网络断开重连时都会进行,也就是网络波动都会形成主机和从机间的一次全量的数据复制,这对实际的系统运营形成了不小的麻烦
Redis宕机?
主从模式下的宕机区分:
注:以上过程很容易配置错误,可使用简单的方法:redis的哨兵(sentinel)的功能。
哨兵(sentinel)的原理:Redis提供了sentinel(哨兵)机制经过哨兵模式启动redis后,自动监控master/slave的运行状态,基本原理是:心跳机制+投票裁决。
心跳机制:每一个sentinel会向其它sentinal、master、slave定时发送消息,以确认对方是否“活”着,若是发现对方在指定时间(可配置)内未回应,则暂时认为对方已挂(所谓的“主观认为宕机” Subjective Down,简称SDOWN)。
投票裁决:若"哨兵群"中的多数sentinel,都报告某一master没响应,系统才认为该master"完全死亡"(即:客观上的真正down机,Objective Down,简称ODOWN),经过必定的vote算法,从剩下的slave节点中,选一台提高为master,而后自动修改相关配置。
哨兵的配置:复制redis中sentinel.conf,根据状况进行配置
在默认状况下, Redis 将数据库快照保存在名字为 dump.rdb
的二进制文件中。能够对 Redis 进行设置, 让它在“ N
秒内数据集至少有 M
个改动”这一条件被知足时, 自动保存一次数据集。
执行保存操做:调用 SAVE 或者 BGSAVE ,手动让 Redis 进行数据集保存操做。一个栗子,save 60 1000 会让 Redis 在知足“ 60
秒内有至少有 1000
个键被改动”这一条件时, 自动保存一次数据集。这种持久化方式被称为快照(snapshot)。
SAVE
:阻塞redis的服务器进程,直到RDB
文件
被建立完毕。BGSAVE
:派生(fork)一个子进程来建立新的RDB文件
,记录接收到BGSAVE
当时的数据库状态,父进程继续处理接收到的命令,子进程完成文件的建立以后,会发送信号给父进程,而与此同时,父进程处理命令的同时,经过轮询来接收子进程的信号。
当Redis须要保存 dump.rdb 文件时,执行如下操做:
fork()
,同时拥有父进程和子进程。这种工做方式使得 Redis 能够从写时复制(copy-on-write)机制中获益。
fork
出一个子进程,而后这个子进程就会处理接下来的全部保存工做,父进程无须执行任何磁盘 I/O 操做。
fork()
建立出一个子进程,并由子进程来进行实际的持久化工做。 在数据集比较庞大时, fork()
可能会很是耗时,形成服务器在某某毫秒内中止处理客户端; 若是数据集很是巨大,而且 CPU 时间很是紧张的话,那么这种中止时间甚至可能会长达整整一秒。 虽然 AOF 重写也须要进行 fork()
,但不管 AOF 重写的执行间隔有多长,数据的耐久性都不会有任何损失。建立子线程和生成rdb文件会占用大量 的系统资源和处理时间
# dbfilename:配置RDB文件的名称,默认叫 dump.rdb dbfilename dump.rdb # dir:配置的RDB文件存储在本地的路径,若是是在 /redis/redis-3.0.6/src 下启动的redis-cli,则数据会存储在当前src目录下 dir ./ # snapshot触发时机的配置:save <seconds> <changes> , 可经过 save “” 关闭snapshot功能 # changes:对于此值设置需谨慎,要评估系统的变动操做密集程度 save 900 1 # 更改了1个key的时候,间隔900秒后,至少有一个变动操做,进行持久化存储snapshot save 300 10 # 更改了10个key的时候,间隔300s进行持久化存储 save 60 10000 # 更改10000个key的时候,间隔360s进行存储。 # 当生成 RDB 文件出错没法继续时,是不然色客户端的“变动操做”,是否继续处理 Redis 写命令,默认为不处理。“错误”可能由于磁盘已满/磁盘故障/OS级别异常等 stop-writes-on-bgsave-error yes # 是否对rdb文件进行压缩,默认为“yes”,压缩每每意味着“额外的cpu消耗”,同时也意味这较小的文件尺寸以及较短的 rdbcompression yes
# 是否对 RDB 文件进行校验和校验
rdbchecksum
Redis shutdown模拟服务器宕机
mv dump.rdb dump.rdb.bak
中止redis服务器service redis stop
启动redis-server /etc/redis/redis.conf redis-cli 查询keys * cp dump.rdb.bak dump.rdb ps aux | grep redis Kill -9 xxxx 中止redis服务器service redis stop 重启redis-server 重启redis-cli 查询keys *
快照功能并非很是耐久(durable): 若是 Redis 由于某些缘由而形成故障停机, 那么服务器将丢失最近写入、且仍未保存到快照中的那些数据。若是对于数据追求彻底耐久能力(full durability)的要求,快照功能就不太适用。从 1.1 版本开始, Redis 增长了一种彻底耐久的持久化方式: AOF 持久化。
经过修改配置文件来打开 AOF 功能:appendonly yes 。每当 Redis 执行一个改变数据集的命令时(好比 SET key value [EX seconds] [PX milliseconds] [NX|XX]), 这个命令就会被追加到 AOF 文件的末尾(对数据的每一条修改命令追加到aof文件)。这样的话,当 Redis 从新启时, 程序就能够经过从新执行 AOF 文件中的命令来达到重建数据集的目的。RDB持久化至关于备份数据库状态,而AOF持久化是备份数据库接收到的命令。
AOF文件生成的过程:命令追加、文件写入、文件同步
由于 AOF 的运做方式是不断地将命令追加到文件的末尾,按照记录日志的方式去工做的,因此随着写入命令的不断增长,成千上万的数据插入必然致使日志文件的扩大,AOF 文件的体积也会变得愈来愈大。举个栗子:若是你对一个计数器调用了 100 次 INCR key , 那么仅仅是为了保存这个计数器的当前值, AOF 文件就须要使用 100 条记录(entry)。然而实际上,只使用一条 SET key value [EX seconds] [PX milliseconds] [NX|XX] 命令已经足以保存计数器的当前值了, 其他 99 条记录实际上都是多余的。
为了处理这种状况, Redis 支持另外一种特性:能够在不打断服务客户端的状况下,对 AOF 文件进行重建(rebuild):执行 BGREWRITEAOF 命令:将日志文件中的全部数据都从新写到另一个新的日志文件中,不一样的是,在旧文件当中对于key的屡次操做,只会保留最终值的那次操做命令记录到日志文件中。Redis 2.2 须要本身手动执行 BGREWRITEAOF 命令; Redis 2.4 则能够自动触发 AOF 重写。
两个配置须要注意:
auto-aof-rewrite-percentage 100 (当前写入日志文件的大小占到初始日志文件大小的某个百分比时触发Rewrite)
auto-aof-rewrite-min-size 64mb (本次Rewrite最小的写入数据量)
两个条件须要同时知足。
AOF 重写和 RDB 建立快照同样,都巧妙地利用了写时复制机制。
如下是 AOF 重写的执行步骤:
fork()
,如今同时拥有父进程和子进程。
fsync
)一次写命令,就算发生故障停机,最多丢失1s的数据。( fsync
会在后台线程执行,因此主线程能够继续努力地处理命令请求)。seek)
, 即便日志由于某些缘由而包含了未写入完整的命令(好比写入时磁盘已满,写入中途停机等), redis-check-aof
工具也能够轻易地修复这种问题。
fsync
策略,AOF 的速度可能会慢于 RDB 。 在通常状况下, 每秒 fsync
的性能依然很是高, 而关闭 fsync
可让 AOF 的速度和 RDB 同样快, 即便在高负荷之下也是如此。 不过在处理巨大的写入载入时,RDB 能够提供更有保证的最大延迟时间(latency)。
# 是否打开 AOF 持久化功能,默认为“no”,可经过“yes”来开启AOF功能 appendonly yes # 只有在“yes”下,aof重写/文件同步等特性才会生效 # 指定AOF文件的名称 appendfilename appendonly.aof # 同步频率:指定AOF操做时,文件的同步策略,有三个合法值:always everysec no,默认为everysec 会影响到服务器间隔多久完成一次命令的记录。 # always:每一条aof记录都当即同步到文件,这是最安全的方式,但大量磁盘操做和阻塞延迟形成IO开支大,速度最慢不推荐。 # everysec:将缓存区的内容每隔一秒写入AOF文件中,性能和安全都比较中庸,是Redis官方推荐的方式。 # no :写入AOF文件中的操做由操做系统决定,Redis不直接调用。通常而言为了提升效率,操做系统会等待缓存区被填满,才会开始同步数据到磁盘。在物理服务器故障时,数据丢失量会因OS配置有关 appendfsync everysec # 在aof-rewrite期间,appendfsync是否暂缓文件同步,"no"表示“不暂缓”,“yes”表示“暂缓”,默认为“no” no-appendfsync-on-rewrite no # aof文件rewrite触发的最小文件尺寸(mb,gb),只有大于此aof文件大于此尺寸是才会触发rewrite,默认“64mb”,建议“512mb” auto-aof-rewrite-min-size 64mb # 相对于“上一次”rewrite,本次rewrite触发时aof文件应该增加的百分比。 # 每一次rewrite以后,redis都会记录下此时“新aof”文件的大小(例如A),那么当aof文件增加到A*(1 + p)以后,触发下一次rewrite,每一次aof记录的添加都会检测当前aof文件的尺寸。
auto-aof-rewrite-percentage 100
# 当前AOF文件启动新的日志重写过程的最小值,避免刚刚启动Reids时因为文件尺寸较小致使频繁的重写。 auto-aof-rewrite-min-size 64mb
- AOF更加安全,能够将数据更加及时的同步到文件中,可是AOF须要较多的磁盘IO开支,AOF文件尺寸较大,文件内容恢复数度相对较慢
- RDB(snapshot),安全性较差,它是“正常时期”数据备份以及 master-slave 数据同步的最佳手段,文件尺寸较小,恢复数度较快。
(1)不要仅仅使用RDB,由于那样会致使你丢失不少数据
(2)也不要仅仅使用AOF,由于那样有两个问题,第一,经过AOF作冷备的操做,没有RDB作冷备来的恢复速度更快; 第二,RDB每次简单粗暴生成数据快照更加健壮,能够避免AOF这种复杂的备份和恢复机制的bug 。
(3)综合使用AOF和RDB两种持久化机制,用AOF来保证数据不丢失,做为数据恢复的第一选择; 用RDB来作不一样程度的冷备,在AOF文件都丢失或损坏不可用的时候,还可使用RDB来进行快速的数据恢复。
在 Redis 2.2 或以上版本,能够在不重启的状况下,从 RDB 切换到 AOF :
dump.rdb
文件建立一个备份。redis-cli> CONFIG SET appendonly yes redis-cli> CONFIG SET save ""
步骤 3 执行的第一条命令开启了 AOF 功能: Redis 会阻塞直到初始 AOF 文件建立完成为止, 以后 Redis 会继续处理命令请求, 并开始将写入命令追加到 AOF 文件末尾。
步骤 3 执行的第二条命令用于关闭 RDB 功能。 这一步是可选的, 若是你愿意的话, 也能够同时使用 RDB 和 AOF 这两种持久化功能。
别忘了在 redis.conf
中打开 AOF 功能! 不然服务器重启以后, 以前经过 CONFIG SET
设置的配置就会被遗忘, 程序会按原来的配置来启动服务器。
AOF
更安全,可将数据及时同步到文件中,但须要较多的磁盘IO,AOF文件
尺寸较大,文件内容恢复相对较慢, 也更完整。RDB
持久化,安全性较差,它是正常时期数据备份及 master-slave
数据同步的最佳手段,文件尺寸较小,恢复数度较快。
官方建议:
find
命令来删除过时的快照: 好比能够保留最近 48 小时内的每小时快照, 还能够保留最近一两个月的每日快照。
从数据集中任意选择数据进行淘汰