redis数据结构实现--简单动态字符串

redis数据结构实现--简单动态字符串

1. SDS简单动态字符串详解

sds是redis本身实现的一种数据结构,用来做为redis底层默认字符串,与c语言的字符串区别开来。
在redis中c字符串通常用于不须要改变的字符串值,叫作字符串字面量,如:打印日志。
redis中每对键值的键都是一个sds对象。redis

传统c字符串与sds比较:算法

  • sds数据结构中也是用字符数组存储字符串,可是带有两个额外参数:len(记录字符串长度)和free(未使用空间)
  • 想要得到传统c字符串的长度不得不遍历整个字符串,然而sds则可直接读取len值。下降了时间复杂度
  • 二者的字符数组都是以空字符'/0'结尾,在sds中此空字符不计入len中可是也一样分配一个字节空间,空字符的相关操做都是由sds的API自动完成的,因此对于开发者来讲此空字符是透明的。sds保持和c字符串一致以空字符做为结尾是为了可以复用c语言的字符串函数库里的函数。
  • 传统c字符串若是在对字符串操做没有注意空间剩余有可能会出现内场溢出的现象,而sds的API中执行拼接操做的函数sdscat,拼接时会先判断空间是否足够,若是不够则会先执行扩容操做,从而杜绝内场溢出.
  • 避免频繁内存重分配:传统c字符串的长度为n+1(空字符),每一次append时须要从新分配内存,不然内存溢出;若是trim字符串,后面不须要的空间也要释放,不然内存泄露。内存重分配设计复杂算法且可能须要系统调度,不符合redis的速度要求。而sds经过free-未使用空间来解除了底层数组长度与字符串长度间的关联,sds拥有空间预分配与惰性空间释放两钟优化策略。数组

    1. 空间预分配
      在对sds空间拓展时,先判断空间是否足够,若是足够,则直接使用未使用空间。若是空间不够则使用空间预分配策略
      若是计算得出的sds修改后的长度小于1MB,那么预分配的未使用空间将于已使用的空间同样长。若是sds修改后的长度大于1MB,
      那么将分配1MB的未使用空间。
      经过这种策略将连续增加N次的sds字符串所需的内存重分配次数从一定是N次改成最多N次。
    2. 惰性空间释放
      在对sds字符串进行缩短操做时,并不当即回收缩短的长度,而是利用free将缩短的字符串记录起来,以备之后拓展时使用。
      一样sdsAPI中也提供了真正回收空间的API,因此惰性空间释放并不会浪费空间。
    • 二进制安全:c字符串必须得符合某种编码,且字符串除了尾部中间不能存放空字符,不然被读取到空字符时忽略后面的字符段。全部c字符串只能存放文本信息不能存放二进制数据。而sds的API都是二进制安全(binary-safe)的,buf中存放的就是一系列二进制数据。
相关文章
相关标签/搜索