和不少大牛谈过,玩python的web框架有一点瓶颈,那就是高并发,可是redis给咱们提供解决高并发,高可用,高性能的弊端。 redis是业界主流的key-value nosql 数据库。和Memcached相似,它支持存储的value类型相对更多,包括string(字符串)、list(链表)、set(集合)、zset(sorted set --有序集合)和hash(哈希类型)。这些数据类型都支持push/pop、add/remove及取交集并集和差集及更丰富的操做,并且这些操做都是原子性的。在此基础上,redis支持各类不一样方式的排序。与memcached同样,为了保证效率,数据都是缓存在内存中。区别的是redis会周期性的把更新的数据写入磁盘或者把修改操做写入追加的记录文件,而且在此基础上实现了master-slave(主从)同步。node
异常快速 : Redis是很是快的,每秒能够执行大约110000设置操做,81000个/每秒的读取操做。python
支持丰富的数据类型 : Redis支持最大多数开发人员已经知道如列表,集合,可排序集合,哈希等数据类型。git
这使得在应用中很容易解决的各类问题,由于咱们知道哪些问题处理使用哪一种数据类型更好解决。github
操做都是原子的 : 全部 Redis 的操做都是原子,从而确保当两个客户同时访问 Redis 服务器获得的是更新后的值(最新值)。web
MultiUtility工具:Redis是一个多功能实用工具,能够在不少如:缓存,消息传递队列中使用(Redis原生支持发布/订阅),在应用程序中,如:Web应用程序会话,网站页面点击数等任何短暂的数据;redis
要在 Ubuntu 上安装 Redis,打开终端,而后输入如下命令:sql
$sudo apt-get update $sudo apt-get install redis-server
这将在您的计算机上安装Redis数据库
启动 Redisubuntu
$redis-server
查看 redis 是否还在运行promise
$redis-cli
这将打开一个 Redis 提示符,以下图所示:
redis 127.0.0.1:6379>
在上面的提示信息中:127.0.0.1 是本机的IP地址,6379是 Redis 服务器运行的端口。如今输入 PING 命令,以下图所示:
redis 127.0.0.1:6379> ping PONG
这说明如今你已经成功地在计算机上安装了 Redis。
1 2 3 4 5 6 7 |
|
要在Ubuntu 上安装 Redis桌面管理,能够从 http://redisdesktop.com/download 下载包并安装它。
Redis 桌面管理器会给你用户界面来管理 Redis 键和数据。
redis-py 的API的使用能够分类为:
链接方式
链接池
操做
String 操做
Hash 操做
List 操做
Set 操做
Sort Set 操做
管道
发布订阅
一、操做模式
redis-py提供两个类Redis和StrictRedis用于实现Redis的命令,StrictRedis用于实现大部分官方的命令,并使用官方的语法和命令,Redis是StrictRedis的子类,用于向后兼容旧版本的redis-py。
1 2 3 4 5 |
|
二、链接池
redis-py使用connection pool来管理对一个redis server的全部链接,避免每次创建、释放链接的开销。默认,每一个Redis实例都会维护一个本身的链接池。能够直接创建一个链接池,而后做为参数Redis,这样就能够实现多个Redis实例共享一个链接池。
redis中的String在在内存中按照一个name对应一个value来存储。如图:
set(name, value, ex=None, px=None, nx=False, xx=False)
1 2 3 4 5 6 |
|
setnx(name, value)
1 |
|
setex(name, value, time)
1 2 3 |
|
psetex(name, time_ms, value)
1 2 3 |
|
mset(*args, **kwargs)
1 2 3 4 5 |
|
get(name)
1 |
|
mget(keys, *args)
1 2 3 4 5 |
|
getset(name, value)
1 |
|
getrange(key, start, end)
1 2 3 4 5 6 |
|
setrange(name, offset, value)
1 2 3 4 |
|
setbit(name, offset, value)
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 |
|
*用途举例,用最省空间的方式,存储在线用户数及分别是哪些用户在线
getbit(name, offset)
1 |
|
bitcount(key, start=None, end=None)
1 2 3 4 5 |
|
strlen(name)
1 |
|
incr(self, name, amount=1)
1 2 3 4 5 6 7 |
|
incrbyfloat(self, name, amount=1.0)
1 2 3 4 5 |
|
decr(self, name, amount=1)
1 2 3 4 5 |
|
append(key, value)
1 2 3 4 5 |
|
hash表现形式上有些像pyhton中的dict,能够存储一组关联性较强的数据 , redis中Hash在内存中的存储格式以下图:
hset(name, key, value)
1 2 3 4 5 6 7 8 9 |
|
hmset(name, mapping)
1 2 3 4 5 6 7 8 |
|
hget(name,key)
1 |
|
hmget(name, keys, *args)
1 2 3 4 5 6 7 8 9 10 11 |
|
hgetall(name)
1 |
|
hlen(name)
1 |
|
hkeys(name)
1 |
|
hvals(name)
1 |
|
hexists(name, key)
1 |
|
hdel(name,*keys)
1 |
|
hincrby(name, key, amount=1)
1 2 3 4 5 |
|
hincrbyfloat(name, key, amount=1.0)
1 2 3 4 5 6 7 8 |
|
hscan(name, cursor=0, match=None, count=None)
Start a full hash scan with:
HSCAN myhash 0
Start a hash scan with fields matching a pattern with:
HSCAN myhash 0 MATCH order_*
Start a hash scan with fields matching a pattern and forcing the scan command to do more scanning with:
HSCAN myhash 0 MATCH order_* COUNT 1000
1 2 3 4 5 6 7 8 9 10 11 12 13 |
|
hscan_iter(name, match=None, count=None)
1 2 3 4 5 6 7 8 9 |
|
List操做,redis中的List在在内存中按照一个name对应一个List来存储。如图:
lpush(name,values)
1 2 3 4 5 6 7 8 |
|
lpushx(name,value)
1 2 3 4 |
|
llen(name)
1 |
|
linsert(name, where, refvalue, value))
1 2 3 4 5 6 7 |
|
r.lset(name, index, value)
1 2 3 4 5 6 |
|
r.lrem(name, value, num)
1 2 3 4 5 6 7 8 |
|
lpop(name)
1 2 3 4 |
|
lindex(name, index)
1 |
|
lrange(name, start, end)
1 2 3 4 5 |
|
ltrim(name, start, end)
1 2 3 4 5 |
|
rpoplpush(src, dst)
1 2 3 4 |
|
blpop(keys, timeout)
1 2 3 4 5 6 7 8 |
|
brpoplpush(src, dst, timeout=0)
1 2 3 4 5 6 |
|
Set操做,Set集合就是不容许重复的列表
sadd(name,values)
1
# name对应的集合中添加元素
scard(name)
1
获取name对应的集合中元素个数
sdiff(keys, *args)
1
在第一个name对应的集合中且不在其余name对应的集合的元素集合
sdiffstore(dest, keys, *args)
1
# 获取第一个name对应的集合中且不在其余name对应的集合,再将其新加入到dest对应的集合中
sinter(keys, *args)
1
# 获取多一个name对应集合的并集
sinterstore(dest, keys, *args)
1
# 获取多一个name对应集合的并集,再讲其加入到dest对应的集合中
sismember(name, value)
1
# 检查value是不是name对应的集合的成员
smembers(name)
1
# 获取name对应的集合的全部成员
smove(src, dst, value)
1
# 将某个成员从一个集合中移动到另一个集合
spop(name)
1
# 从集合的右侧(尾部)移除一个成员,并将其返回
srandmember(name, numbers)
1
# 从name对应的集合中随机获取 numbers 个元素
srem(name, values)
1
# 在name对应的集合中删除某些值
sunion(keys, *args)
1
# 获取多一个name对应的集合的并集
sunionstore(dest,keys, *args)
1
# 获取多一个name对应的集合的并集,并将结果保存到dest对应的集合中
sscan(name, cursor=0, match=None, count=None)
sscan_iter(name, match=None, count=None)
1
# 同字符串的操做,用于增量迭代分批获取元素,避免内存消耗太大
有序集合,在集合的基础上,为每元素排序;元素的排序须要根据另一个值来进行比较,因此,对于有序集合,每个元素有两个值,即:值和分数,分数专门用来作排序。
zadd(name, *args, **kwargs)
1
2
3
4
5
# 在name对应的有序集合中添加元素
# 如:
# zadd('zz', 'n1', 1, 'n2', 2)
# 或
# zadd('zz', n1=11, n2=22)
zcard(name)
1
# 获取name对应的有序集合元素的数量
zcount(name, min, max)
1
# 获取name对应的有序集合中分数 在 [min,max] 之间的个数
zincrby(name, value, amount)
1
# 自增name对应的有序集合的 name 对应的分数
r.zrange( name, start, end, desc=False, withscores=False, score_cast_func=float)
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
# 按照索引范围获取name对应的有序集合的元素
# 参数:
# name,redis的name
# start,有序集合索引发始位置(非分数)
# end,有序集合索引结束位置(非分数)
# desc,排序规则,默认按照分数从小到大排序
# withscores,是否获取元素的分数,默认只获取元素的值
# score_cast_func,对分数进行数据转换的函数
# 更多:
# 从大到小排序
# zrevrange(name, start, end, withscores=False, score_cast_func=float)
# 按照分数范围获取name对应的有序集合的元素
# zrangebyscore(name, min, max, start=None, num=None, withscores=False, score_cast_func=float)
# 从大到小排序
# zrevrangebyscore(name, max, min, start=None, num=None, withscores=False, score_cast_func=float)
zrank(name, value)
1
2
3
4
# 获取某个值在 name对应的有序集合中的排行(从 0 开始)
# 更多:
# zrevrank(name, value),从大到小排序
zrem(name, values)
1 2 3 |
|
zremrangebyrank(name, min, max)
1 |
|
zremrangebyscore(name, min, max)
1 |
|
zscore(name, value)
1 |
|
zinterstore(dest, keys, aggregate=None)
1 2 |
|
zunionstore(dest, keys, aggregate=None)
1 2 |
|
zscan(name, cursor=0, match=None, count=None, score_cast_func=float)
zscan_iter(name, match=None, count=None,score_cast_func=float)
1 |
|
delete(*names)
1
# 根据删除redis中的任意数据类型
exists(name)
1
# 检测redis的name是否存在
keys(pattern='*')
1
2
3
4
5
6
7
# 根据模型获取redis的name
# 更多:
# KEYS * 匹配数据库中全部 key 。
# KEYS h?llo 匹配 hello , hallo 和 hxllo 等。
# KEYS h*llo 匹配 hllo 和 heeeeello 等。
# KEYS h[ae]llo 匹配 hello 和 hallo ,但不匹配 hillo
expire(name ,time)
1
# 为某个redis的某个name设置超时时间
rename(src, dst)
1
# 对redis的name重命名为
move(name, db))
1
# 将redis的某个值移动到指定的db下
randomkey()
1
# 随机获取一个redis的name(不删除)
type(name)
1
# 获取name对应值的类型
scan(cursor=0, match=None, count=None)
scan_iter(match=None, count=None)
1
# 同字符串操做,用于增量迭代获取key
redis-py默认在执行每次请求都会建立(链接池申请链接)和断开(归还链接池)一次链接操做,若是想要在一次请求中指定多个命令,则可使用pipline实现一次请求指定多个命令,而且默认状况下一次pipline 是原子性操做。
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 |
|
发布者:服务器
订阅者:Dashboad和数据处理
Demo以下:
订阅者:
1 2 3 4 5 6 7 8 9 10 11 |
|
发布者:
1 2 3 4 5 6 7 |
|
更多参见:https://github.com/andymccurdy/redis-py/
http://doc.redisfans.com/
Go for legacy relational databases (RDBMS) when:
The data is well structured, and lends itself to a tabular arrangement (rows and columns) in a relational database. Typical examples: bank account info, customer order info, customer info, employee info, department info etc etc.
Another aspect of the above point is : schema oriented data model. When you design a data model (tables, relationships etc) for a potential use of RDBMS, you need to come up with a well defined schema: there will be these many tables, each table having a known set of columns that store data in known typed format (CHAR, NUMBER, BLOB etc).
Very Important: Consider whether the data is transactional in nature. In other words, whether the data will be stored, accessed and updated in the context of transactions providing the ACID semantics or is it okay to compromise some/all of these properties.
Correctness is also important and any compromise is _unacceptable_. This stems from the fact that in most NoSQL databases, consistency is traded off in favor of performance and scalability (points on NoSQL databases are elaborated below).
There is no strong/compelling need for a scale out architecture ; a database that linearly scales out (horizontal scaling) to multiple nodes in a cluster.
The use case is not for “high speed data ingestion”.
If the client applications are expecting to quickly stream large amounts of data in/out of the database then relational database may not be a good choice since they are not really designed for scaling write heavy workloads.
In order to achieve ACID properties, lots of additional background work is done especially in writer (INSERT, UPDATE, DELETE) code paths. This definitely affects performance.
The use case is not for “storing enormous amounts of data in the range of petabytes”.
Go for NoSQL databases when:
There is no fixed (and predetermined) schema that data fits in:
Scalability, Performance (high throughput and low operation latency), Continuous Availability are very important requirements to be met by the underlying architecture of database.
Good choice for “High Speed Data Ingestion”. Such applications (for example IoT style) which generate millions of data points in a second and need a database capable of providing extreme write scalability.
The inherent ability to horizontally scale allows to store large amounts of data across commodity servers in the cluster. They usually use low cost resources, and are able to linearly add compute and storage power as the demand grows.
source page https://www.quora.com/When-should-you-use-NoSQL-vs-regular-RDBMS
准备环境:
由于找不到可用的1000M网络机器,使用一根直通线将两台笔记本连起来组成1000M Ethernet网。没错,是直通线如今网卡都能自适应交叉线、直通线,速度不受影响,用了一段时间机器也没出问题。
服务端:T420 i5-2520M(2.5G)/8G ubuntu 11.10
客户端:Acer i5-2430M(2.4G)/4G mint 11
redis版本:2.6.9
测试脚本:./redis-benchmark -h xx -p xx -t set -q -r 1000 -l -d 20
长度 | 速度/sec | 带宽(MByte/s) 发送+接收 | CPU | CPU Detail |
20Byte | 17w | 24M+12M | 98.00% | Cpu0 : 21.0%us, 40.7%sy, 0.0%ni, 4.3%id, 0.0%wa, 0.0%hi, 34.0%si, 0.0%st |
100Byte | 17w | 37M+12M | 97.00% | Cpu0 : 20.3%us, 37.9%sy, 0.0%ni, 7.0%id, 0.0%wa, 0.0%hi, 34.9%si, 0.0%st |
512Byte | 12w | 76M+9M | 87.00% | Cpu0 : 20.9%us, 33.2%sy, 0.0%ni, 25.6%id, 0.0%wa, 0.0%hi, 20.3%si, 0.0%st |
1K | 9w | 94M+8M | 81.00% | Cpu0 : 19.9%us, 30.2%sy, 0.0%ni, 34.2%id, 0.0%wa, 0.0%hi, 15.6%si, 0.0%st |
2K | 5w | 105M+6M | 77.00% | Cpu0 : 18.0%us, 32.0%sy, 0.0%ni, 34.7%id, 0.0%wa, 0.0%hi, 15.3%si, 0.0%st |
5K | 2.2w | 119M+3.2M | 77.00% | Cpu0 : 22.5%us, 32.8%sy, 0.0%ni, 32.8%id, 0.0%wa, 0.0%hi, 11.9%si, 0.0%st |
10K | 1.1w | 119M+1.7M | 70.00% | Cpu0 : 18.2%us, 29.8%sy, 0.0%ni, 42.7%id, 0.0%wa, 0.0%hi, 9.3%si, 0.0%st |
20K | 0.57w | 120M+1M | 58.00% | Cpu0 : 17.8%us, 26.4%sy, 0.0%ni, 46.2%id, 0.0%wa, 0.0%hi, 9.6%si, 0.0%st |
value 在1K以上时,1000M网卡轻松的被跑慢,并且redis-server cpu连一个核心都没占用到,可见redis高效,redis的服务也不须要过高配置,瓶颈在网卡速度。
整理看redis的us都在20%左右,用户层代码资源占用比例都很小。
redis pool = redis.ConnectionPool(=, =,=,=) r = redis.Redis(=pool) pipe = r.pipeline(=) pipe.set(, ) pipe.set(, ) pipe.execute() (r.get())