欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页  >  IT编程

redis系列之------简单的动态字符串(SDS)

程序员文章站 2022-03-29 18:08:02
前言 Redis 没有直接使用 C 语言传统的字符串表示(以空字符结尾的字符数组,以下简称 C 字符串), 而是自己构建了一种名为简单动态字符串(simple dynamic string,SDS)的抽象类型, 并将 SDS 用作 Redis 的默认字符串表示。 个人感觉SDS类似于Java的Arr ......

前言

redis 没有直接使用 c 语言传统的字符串表示(以空字符结尾的字符数组,以下简称 c 字符串), 而是自己构建了一种名为简单动态字符串(simple dynamic string,sds)的抽象类型, 并将 sds 用作 redis 的默认字符串表示。

个人感觉sds类似于java的arraylist,大家可以拿两者对比一些,谁的效率更加高一点。

 

sds定义

 1 struct sdshdr {
 2 
 3     // 记录 buf 数组中已使用字节的数量
 4     // 等于 sds 所保存字符串的长度
 5     int len;
 6 
 7     // 记录 buf 数组中未使用字节的数量
 8     int free;
 9 
10     // 字节数组,用于保存字符串
11     char buf[];
12 
13 };

这里注意一下。c语言的char是占一个字节的。不像java的char占两个字节。也就是只有八位,-127 - 128。

 

sds相比于c字符串的优势

1. 常数复杂度获取字符串长度

  • 这个比较好理解,因为sds里面有一个字段为len,可以直接获取长度

2. 减少修改字符串时带来的内存重分配次数

  • 因为传统的c字符串,不会自动扩容。而且其内存大小就等于字符串长度+1,因此,每修改一次字符串,都要重新分配一次内存,非常的耗费时间
  • sds会自动扩容,并且会进行空间预分配。比如现在有一个hello的字符串。内存的大小可能是hello的两倍,也就是 5 * 2  = 10。当再次扩容字符串的时候,不一定需要再次分配内存了。并且可以自动扩容,假设10不够了,加了一个字符串后大小为13,那么内存就会分配为 13 * 2 = 26大小的内存。

3. 二进制安全,以及可以保存空字符 

  • c 字符串中的字符必须符合某种编码(比如 ascii), 并且除了字符串的末尾之外, 字符串里面不能包含空字符, 否则最先被程序读入的空字符将被误认为是字符串结尾 —— 这些限制使得 c 字符串只能保存文本数据, 而不能保存像图片、音频、视频、压缩文件这样的二进制数据。
  • 因此,所有 sds api 都会以处理二进制的方式来处理 sds 存放在 buf 数组里的数据
  • 也就是保存在buf数组里面的所有东西,不论英文中文,还是图片音频,都是二进制数据流。