http://www.searchdatabase.com.cn/showcontent_70423.htm html
开源项目SpringSide发起人肖桦(@江南白衣Calvin)在动手试用了Redis数据库一周以后,总结了一些关于Redis的常识,在这里分享给你们。 java
1. Overview mysql
1.1 资料 git
1.2 优缺点 github
- 很是很是的快, 有测评说比Memcached还快。
- 丰富的数据结构,超越了通常的Key-Value数据库,组合使用各类结构,限制Redis用途的只会是你本身的想象力, Redis在互联网上的11种常见用例。
- 由于是我的做品,Redis的代码量也就1万行左右,大多选择了比较Simple的作法,使得普通公司而不是文艺公司也能够吃透它。
- 做者认为Redis 2.6版已经成熟,2013年的精力会放在HA和Scalable上,也就是Redis-Sentinel和Redis-Cluster了。
1.3 八卦 web
- 做者是意大利的Salvatore Sanfilippo(antirez),又是VMWare大善人聘请了他专心写Redis。
- antirez和我同样不喜欢搞什么咨询服务,因此Commercial Support是不会有了。
- 默认端口6379,是手机按键上MERZ对应的号码,意大利歌女Alessia Merz是antirez和朋友们认为愚蠢的代名词。
2. 数据结构 redis
2.1 Key 算法
- Key 能够是任意类型,最后都存成byte[]
- Key 不能太长,好比1024字节,但做者也不追求过短,要表达清楚意思才好,做者建议用":"分隔表名,用"."做为单词间的链接。
- KEYS显示全部的key,支持通配符 "KEYS a*" , "keys a?c",但不建议在生产环境大数据量下使用。
- SORT,对集合按数字或字母顺序排序后返回,或者存到另外一个List,还能够关联到外部Key等。由于会耗用CPU,有时会安排到slave上执行。
- EXPIRE/EXPREAT/PERSIST/TTL/,关于Key超时的操做,默认以秒为单位,也有p字头的以毫秒为单位的版本。
- 其余命令: EXISTS,DEL,RENAME/RENAMENX(仅当new key不存在时),MOVE/MIGRATE(实例内今后db到彼db/今后实例到彼实例),RANDOMKEY,TYPE/Object(Key的类型/对象编码类型,空置时间),DUMP/RESTORE(value值的持久化)
2.2 String spring
最普通的key-value,除了支持最基本的get/set, Redis也很喜欢添加一些简便的指令,在服务端作起来是举手之劳,客户端便方便不少。 sql
- incr/decr/incrby/incrbyfloat, 若是key还不存在时建立key并设原值为0。
- setEx/pSetEx, Set + Expire 的简便写法,p字头以毫秒为单位。
- setNx, key不存在时才put进去。
- getset, 设置新值,返回旧值。
- mget/mset/msetex, 一次get/set多个key。
- getbit/setbit/bitop/bitcount bitmap玩法,好比统计今天的访问用户,每一个用户有一个offset,今天进来的话就把那个位为1。
- append/setrange/getrange,只对特定的数据格式好比字段定长的有用,json格式就没用。
2.3 Hash
Key-HashMap结构,相比2.2中的JSON格式Value,能够只读取/更新对象的某些属性,有些属性超长就让它一边呆着不动。。
另外一个用法是用来建索引。好比User对象,除了id有时还要按name来查询,能够建一个Key为user:index:name的Hash,在插入User对象时(set user:101 {"id":101,"name":"calvin"}), 顺便往这个hash插入一条(hset user:index:name calvin 101),这时calvin做为hash里的一个key,值为101。按name查询的时候,用hget user:index:name calvin 就能从名为calvin的key里取出id。
2.4 List
Redis里能够当双向链表来用,还提供blocking版本的pop函数,能够当Message Queue来用。
不过List并无JMS的ack机制,若是消费者把job给Pop走了又没处理完就死机了怎么办? 解决方法之一是加多一个sorted set,以分发时间为score,用户把job作完了以后要去消掉它。
除了List标准的双向POP/PUSH外,还支持对队列内容的直接操做,好比LREM/LSET/LINSERT/LINDEX。
另外常常用LTRIM限制List的大小,好比只保留最新的20条消息。LRANGE不一样于POP直接弹走元素,只是返回列表内一段下标的元素。LLEN获取列表的长度。
2.5 Set
Set就是Set,还提供一些交集,并集,差集的集合操做。
2.6 Sorted Set
有序集,元素放入集合的时候要同时提供该元素的分数。
2.7 事务
用Multi/Exec/Discard实现, 隔离级别是这边事务一天不提交,那边另外一个事务仍是看到旧的值。 还有个Watch指令,起到CAS的效果,若是事务提交时,Key的值已被别的事务改变,事务会被打断。
2.8 Lua Script
Redis2.6内置的Lua Script支持,能够在Redis的Server端一次过运行大量逻辑。
- 整个Script默认是在一个事务里的。
- Script里涉及的全部Key尽可能用变量,从外面传入,使Redis一开始就知道你要改变哪些key。
- EVAL每次传输一整段Script比较费带宽,能够先用SCRIPT LOAD载入script,返回哈希值。而后用EVALHASH执行。
- 内置的LUA库里还很贴心的带了CJSON,能够处理JSON字符串。
3. 性能
- 速度太快了,用光了带宽也测不出极限。若是是本地socket直连,incr能够去到很吓人的几十万TPS。
- 普通的get/set操做,通过了LAN,延时也只有1毫秒左右,能够放心使用,不用像调用REST接口和访问数据库那样,多一次外部访问都心痛。
- 自带的redis-benchmark默认只是基于一个很小的数据集进行测试,但可调整命令行参数如 redis-benchmark -r 10000000 -n 10000000 -d 128 -t SET,GET 就能够默认开50条线程,SET 6M条左右(random)key是21字节长,value是128字节长的数据进去, 再GET出来。
- 若是要一次发送多条指令,PipeLining模式能让性能更快,由于它在设计上正视了网络往返的时间。
- 更快的是Lua Script模式,还能够包含逻辑,直接在服务端又get又set的 (见2.8 Lua Script)。
- 单线程单CPU架构,但做者认为CPU不是瓶颈,内存与网络带宽才是。
- 发现执行缓慢的命令,可配置执行超过多少时间的指令算是缓慢指令(默认10毫秒,不含IO时间),能够用slowlog get 指令查看(默认只保留最后的128条)。单线程的模型下,某个请求占掉10毫秒是件大事情。
4. 容量
最大内存:
- 必定要设置最大内存,不然物理内存用爆了就会大量使用Swap,写RDB文件时的速度慢得你想死。
- 多留一倍内存是最安全的。重写AOF文件和RDB文件的进程(即便不作持久化,复制到Slave的时候也要写RDB)会fork出一条新进程来,采用了操做系统的Copy-On-Write策略(若是父进程的内存没被修改,子进程与父进程共享Page。若是父进程的Page被修改, 会复制一份改动前的内容给新进程),留意Console打出来的报告,如"RDB: 1215 MB of memory used by copy-on-write"。在系统极度繁忙时,若是父进程的全部Page在子进程写RDB过程当中都被修改过了,就须要两倍内存。
- 按照Redis启动时的提醒,设置 vm.overcommit_memory = 1 ,使得fork()一条10G的进程时,由于COW策略而不必定须要有10G的free memory.
- 当最大内存到达时,按照配置的Policy进行处理, 默认policy为volatile-lru, 对设置了expire time的key进行LRU清除(不是按实际expire time)。若是沒有数据设置了expire time或者policy为noeviction,则直接报错,但此时系统仍支持get之类的读操做。 另外还有几种policy,好比volatile-ttl按最接近expire time的,allkeys-lru对全部key都作LRU。
- 原来2.0版的VM(将Value放到磁盘,Key仍然放在内存),2.4版后又不支持了。
内存占用:
- 测试代表,stirng类型须要90字节的额外代价,就是说key1个字节,value一个字节时,仍是须要占用92字节的长度,而上述的benchmark的记录就占用了239个字节。
- 用make 32bit能够编译出32位的版本,每一个指针占用的内存更小,但只支持最大4GB内存。
Sharding:
- Jedis支持在客户端作分区,局限是不能动态re-sharding, 有分区的master倒了,必须用slave顶上。要增长分区的话,呃.....
- Redis-Cluster是今年工做重点,支持automatic re-sharding, 采用和Hazelcast相似的算法,总共有N个分区,每台Server负责若干个分区。客户端先hash出key 属于哪一个分区,而后发给负责这个分区的Server。Re-sharding时,会将某些分区的数据移到新的Server上,而后各Server周知分区<->Server映射的变化,由于分区数量有限,因此通信量不大。 在迁移过程当中,原server对于已经迁移走的数据的get请求,会回一个临时转向的应答。
5. 高可用性
5.1 持久化
综述: 解密Redis持久化(中文归纳版),英文原版
RDB文件:
- 整个内存的压缩过的Snapshot,RDB的数据结构, 能够配置写Snapshot的复合触发条件,默认是60秒内改了1万次或300秒内改了10次或900秒内改了1次。
- RDB在写入过程当中,会连内存一块儿Fork出一个新进程,遍历新进程内存中的数据写RDB。
- 先写到临时文件再Rename,这样外部程序对RDB文件的备份和传输过程是安全的。并且即便写新快照的过程当中Server被强制关掉了,旧的RDB文件还在。
- 可配置是否进行压缩,方法是是字符串的LZF算法 和String形式的数字变回int形式存储。
AOF文件:
- append only的操做日志,等于mysql的binlog,记录全部有效的写操做,格式是明文的Redis协议的纯文本文件。
- 通常配置成每秒调用一次fsync将数据写到磁盘,坏处是操做系统非正常关机时,可能会丢1秒的数据。 若是设为fsync always,性能只剩几百TPS,不用考虑。
- 若是使用了AOF,重启时只会从AOF文件载入数据,不会管RDB文件。
- AOF文件过大时,会fork出一条新进程来将文件重写(也是先写临时文件再rename), 遍历新进程的内存中数据,每条记录有一条的Set语句。默认配置是当AOF文件大小是上次rewrite后的大小的一倍时触发。
- Redis协议的内容,如set mykey hello, 将持久化成*3 $3 set $5 mykey $5 hello, 第一个数字表明这条语句有多少元,其余的数字表明后面字符串的长度。这样的设计,使得即便在写文件过程当中忽然关机致使文件不完整,也能自我修复,执行redis-check-aof便可。
RDB不会实时写入数据,并且若是同时使用二者,但服务器重启只会找AOF文件。那要不要只使用AOF呢?做者建议不要,由于RDB更适合用于备份数据库,快速重启,并且不会有AOF可能潜在的bug,留着做为一个万一的手段。
读写性能:
- AOF重写和RDB写入都是在fork出进程后,遍历新进程内存顺序写的,既不影响主进程,顺序写的速度也比随机写快,在普通PC服务器上把刚才的1.5G数据写成一个200M的RDB文件大约8秒, 启动时载入一个1.4G的AOF文件大约13秒。
- 2.4版之后,lpush能够一次push多个值了,使得AOF重写时能够将旧版本中的多个lpush指令合成一个。
- 有人建议设置no-appendfsync-on-rewrite 为 yes,aof rewrite时就不执行fsync了,先都存在内存里,减小IO资源争用。 固然这样会丢数据。
- Fork一个使用了大量内存的进程也要时间,大约10ms per GB的样子,各类系统的对比。
其余:
- 正确关闭服务器:redis-cli shutdown 或者 kill,都会graceful shutdown,保证写RDB文件以及将AOF文件fsync到磁盘,不会丢失数据。 若是是Ctrl+C,或者kill -9 就会丢失数据。
- 执行指令bgsave 可触发rdb存盘,bgrewriteaof可触发aof重写。
5.2 Master-Slave复制
- 能够在配置文件、命令行参数、以及执行SLAVEOF指令的来设置。
- 当前版本,一旦执行SlaveOF, slave会清掉本身的全部数据,执行一次全同步:Master要bgsave出本身的一个RDB文件,发给Slave。而后再增量同步: Master做为一个普通的client连入slave,将全部写操做转发给slave,没有特殊的同步协议。
- 做者在2.8版本中将支持PSYNC部分同步
- 测试代表同步延时很是小。
- 有建议只在Slave上写RDB和AOF文件,但这样master启动时就须要从slave copy文件,fail-over脚本也更复杂。只要有足够内存,master平时IO也不高的话,仍是简化架构更好。
5.3 Fail-Over
5.3.1 概述
Redis-sentinel是2.6版开始加入的另外一组独立运行的节点, 提供自动Fail Over的支持。
- 每秒钟对全部master,slave和其余sentinel执行ping,redis-server节点要应答+PONG或-LOADING或-MASTERDOWN.
- 若是某一台Sentinel没有在30秒内(可配置得短一些哦)收到上述正确应答,它就会认为master处于sdown状态(主观Down)
- 它向其余sentinel询问是否也认为master倒了(SENTINEL is-master-down-by-addr ), 若是quonum台(默认是2)sentinels在5秒钟内都这样认为,就会认为master真是odown了(客观Down)。
- 此时会选出一台sentinel做为Leader执行fail-over, Leader会从slave中选出一个提高为master(执行slaveof none),这台slave必须状态正常,并且INFO显示它与master的复制链接并无断开过久。而后让其余slave指向它(执行slaveof new master)。
5.3.2 master/slave 及 其余sentinels的发现
master地址在sentinel的配置文件里, sentinel会每10秒一次向master发送INFO,知道master的slave有哪些。 若是master已经变为slave,sentiel会分析INFO的应答指向新的master。因此当sentiel重启时,它的配置文件里master的地址并没变,那它仍然会去找old master,而后被redirect到新的master。但若是old master还没起来,或者old master没把本身变成slave,悲剧就可能发生。
另外,sentinel会在master上建一个pub/sub channel,通告各类信息,好比+sdown/-sdown, 并且sentinel们也是经过接收pub/sub channel上的+sentinel的信息发现彼此,由于每台sentinel每5秒会发送一次__sentinel__:hello,宣告本身的存在。
5.3.3 自定义脚本
- sentinel在failover时还会执行配置文件里指定的用户reconfig脚本,让master变为slave并指向新的master。
- 脚本在以下时机被调用: 1. slave开始提高成master,2.全部slave都已指向新master,3.各类缘由提高被终止。
- 脚本的将会在命令行按顺序传入以下参数: <master-name> <role(leader/observer)> <state(上述三种状况)> <from-ip> <from-port> <to-ip> <to-port>
- 脚本返回0是正常,若是返回1会被从新执行,若是返回2或以上不会。 若是超过60秒没返回会被强制终止。
另外一种notify脚本在收到任何pub/sub信息时都会调用,让你去通知O&M系统。
5.3.4 Client集成
client中执行语句SENTINEL get-master-addr-by-name mymaster 可得到当前master的地址。 可是Jedis还没集成sentinel,只有一个热心网友提交了pull request
淘宝的Tedis driver,使用了彻底不一样的思路,不基于Sentinel,而是多写随机读,学术名词是ReadOne-WriteAll-tx(see NoSQL数据库的分布式算法), 一开始就同步写入到全部节点,读的话随便读一个还活着的节点就好了。(但节点死掉从新起来后怎么从新同步?何时能够从新做为一个可选的master?)
Redis做者也在博客里抱怨怎么没有人作Dynamo-style 的client。
5.4 Geographic-Redundancy
一个方法是用rsync等工具同步RDB文件,但RDB文件是很是不实时的。
若是要求更高,能够本身写程序读取AOF文件或MONITOR,把指令转发给远处的站点,反正里头的内容就是Redis协议。
6. 维护
配置
能够在配置文件中编写, 也能够在启动时的命令行配置, 如redis-server --port 7777 --slaveof 127.0.0.1 8888,还能够在cli中执行CONFIG GET, 能够达到不重启服务的修改配置参数的效果。
监控
Redis监控技巧 有详细的介绍。
INFO指令将返回很是丰富的信息。
- 着重监控检查内存使用,好比是否已接近上限,好比有无大量使用swap(used_memory - used_memory_rss)
- 还有AOF与RDB文件的保存状况,master-slave的关系也要重点监控。
- STAT中信息还包括key命中率,全部命令的执行次数,全部client链接数量等,CONFIG RESETSTAT 可重置。
其余
- SlowLog 检查慢操做(见2.性能)
- 配置sentinel的notify.sh脚本对全部事件告警或本身用PING/INFO监控节点状态(见5.3.3)
- MONITOR能够显示Server收到的全部指令,能够用于debug。
- Redis live, 基于Python的DashBoard,使用INFO和MONITOR得到系统状况和指令统计分析。
- Instagram的Redis Faina,基于Python,使用MONITOR对指令进行统计分析.
- Redis-rdb-tools 基于Python,能够分析RDB文件,好比每条Key对应value所占的大小,还能够将RDB dump成文本文件而后进行比较,还能够将RDB输出成JSON格式。
- Redis做者本身写的Redis Sampler,基于Ruby,统计数据分布状况。
维护
- 用redis-check-aof/redis-check-dump 修复烂掉的文件。
- 在系统闲时调用 bgrewriteaof 重写AOF文件。
7. 其余
过时数据清除 ,过时数据的清除历来不容易,Redis使用了一种相对务实的作法
- 当client主动get的时候会先进行判断。
- 若是clien永远都再也不get那条key呢? 它会在后台,每秒10次的执行以下操做: 随机选取100个key校验是否过时,若是有25个以上的key过时了,马上随机选取下100个key,可见若是数据不被主动get,它何时最终被清理掉是未知的。
- 上述主动清理只会在master进行,slave们会收到从master发过来的DEL指令,master的AOF文件也会插入一条DEL。
Redis如何处理客户端链接
8. Java Driver
各个Driver好像只有Jedis比较活跃。
不须要Spring Data Redis的封装,由于Jedis已足够简单,因此它没有像对MongoDB java driver的封装那样能简化代码,所谓屏蔽各类底层driver的差别并不太吸引人,由于我就没打算选其余几种driver。
Jedis基于Apache Commons Pool作的链接池,默认最大链接数只有8,通常须要从新设置。
9. Windows的版本
Windows版本方便单机调测,但Redis并无提供,好在微软提供了一个,暂时基于Redis 2.4版本。 https://github.com/MSOpenTech/redis 由于github如今已经没有Download服务了,因此编译好的可执行文件藏在这里 https://github.com/MSOpenTech/redis/tree/2.4/msvs/bin/release
原文出处:https://github.com/springside/springside4/wiki/redis