Redis的简单动态字符串实现

Redis 没有直接使用 C 语言传统的字符串表示(以空字符结尾的字符数组,如下简称 C 字符串), 而是本身构建了一种名为简单动态字符串(simple dynamic string,sds)的抽象类型, 并将sds用做 Redis 的默认字符串表示。c++

sds简单动态字符串数据结构以下:git

1 typedef char *sds;
2 
3 struct sdshdr {
4     int len;
5     int free;
6     char buf[];
7 };

len记录字符串的长度,free记录sds还剩余的空间,buf指向存储字符的空间。redis

对应的内存空间以下图:编程

例如最开始要存放字符串“chenrancc”:数组

通常开始的时候会比初始字符串多申请一个长度的空间放\0,如上图所示,对应的函数是sdsnewlen
删除后面的cc字符后:数据结构

删除后面的cc字符后,空出两个字符空间并不会回收,而是用free来记录。若是要回收者两个空闲的空间,必须从新分配一个新的sds,作法是将原来的sds经过realloc从新分配成新的sds,对应的函数为sdsRemoveFreeSpace。若是要增长sds的空间,也是用一样的方法经过realloc从新分配一个新的sds,对应的函数是sdsMakeRoomFor编程语言

要回收sds所在的内存空间,能够经过函数sdsfree,它实际调用的是free函数。ide

除了上面提到的函数,sds中还定义了不少其它的函数来方便上层使用:函数

 1 sds sdsnewlen(const void *init, size_t initlen);  //用长度为initlen的字符串建立sds
 2 sds sdsempty(void);  //建立一个长度为0的sds
 3 sds sdsnew(const char *init);  //用null结尾的字符串建立sds
 4 sds sdsdup(const sds s);  //拷贝一个sds
 5 void sdsfree(sds s);  //释放sds所占的内存空间
 6 void sdsupdatelen(sds s);  //更新sds中的len为实际的字符串长度
 7 void sdsclear(sds s);  //将sds中的字符串为空串
 8 sds sdsMakeRoomFor(sds s, size_t addlen);  //sds字符串所占空间增长addlen个字符(包括free所占的字符)
 9 sds sdsRemoveFreeSpace(sds s);  //去除sds中空闲的空间
10 size_t sdsAllocSize(sds s);  //获取sds实际占用空间的大小
11 void sdsIncrLen(sds s, int incr);  //sds实际字符串的长度增长incr
12 sds sdsgrowzero(sds s, size_t len);  //将sds所占的空间增长到len,增长的空间都清零
13 sds sdscatlen(sds s, const void *t, size_t len);  //sds末尾链接一个长度为len的字符串
14 sds sdscat(sds s, const char *t);  //sds末尾链接一个以null结尾的字符串
15 sds sdscatsds(sds s, const sds t);  //sds末尾链接另外一个sds
16 sds sdscpylen(sds s, const char *t, size_t len);  //拷贝长度为len的字符串到sds中
17 sds sdscpy(sds s, const char *t);  //拷贝以null结尾的字符串到sds中
18 sds sdscatvprintf(sds s, const char *fmt, va_list ap);  //sds末尾链接一个由可变参数造成的字符串
19 sds sdscatprintf(sds s, const char *fmt, ...);  //sds末尾链接一个由可变参数造成的字符串
20 sds sdstrim(sds s, const char *cset);  //去除sds字符串的先后字符,这些字符都是在cset中出现过的
21 void sdsrange(sds s, int start, int end);  //获取sds字符串的一个字串,start和end能够为负数,负数表示从后面往前面索引
22 void sdstolower(sds s);  //将sds字符串中的字符设置为小写
23 void sdstoupper(sds s);  //将sds字符串中的字符设置为大写
24 int sdscmp(const sds s1, const sds s2);  //比较两个字符串的大小
25 sds *sdssplitlen(const char *s, int len, const char *sep, int seplen, int *count);  //用字符串sdp分割一个sds为多个sds
26 void sdsfreesplitres(sds *tokens, int count);  //释放由函数sdssplitlen返回的sds数组空间
27 sds sdsfromlonglong(long long value);  //将long long类型的数字转化为一个sds
28 sds sdscatrepr(sds s, const char *p, size_t len);  //sds末尾链接一个长度为len的字符串,而且将其中的不可打印字符显示出来
29 int is_hex_digit(char c);  //判断一个字符释放为16进制数字
30 int hex_digit_to_int(char c);  //将一个16进制数字转化为整数
31 sds *sdssplitargs(const char *line, int *argc);  //将一行文本分割成多个参数,每一个参数能够用类编程语言 REPL格式,若是空格,\n\r\t\0等做为分隔符
32 sds sdsmapchars(sds s, const char *from, const char *to, size_t setlen) //将sds中出如今from中的字符替换为to对应的字符
33 sds sdsjoin(char **argv, int argc, char *sep);  //将多个字符串用分割符链接起来组成一个sds
View Code

sds和c++中的vector很相似,惟一不一样的是vector在空间不够的时候能够自动增长2倍的空间。spa

了解了sds的实现,想一想为何redis非要本身实现一个字符串,而不是使用c所支持的字符串和相关的操做呢?

相比c语言中的字符串,sds有以下的好处:

  • 记录了字符串的长度,用O(1)的时间复杂度能够得到字符串的长度。
  • 有效的管理字符串所占用的空间,自动扩展空间等。
  • 有效的防止内存越界,由于若是空间不够,sds的相关函数会自动扩展空间。
相关文章
相关标签/搜索