redis系列之------简单的动态字符串(SDS)
程序员文章站
2022-03-29 18:08:02
前言 Redis 没有直接使用 C 语言传统的字符串表示(以空字符结尾的字符数组,以下简称 C 字符串), 而是自己构建了一种名为简单动态字符串(simple dynamic string,SDS)的抽象类型, 并将 SDS 用作 Redis 的默认字符串表示。 个人感觉SDS类似于Java的Arr ......
前言
redis 没有直接使用 c 语言传统的字符串表示(以空字符结尾的字符数组,以下简称 c 字符串), 而是自己构建了一种名为简单动态字符串(simple dynamic string,sds)的抽象类型, 并将 sds 用作 redis 的默认字符串表示。
个人感觉sds类似于java的arraylist,大家可以拿两者对比一些,谁的效率更加高一点。
sds定义
1 struct sdshdr { 2 3 // 记录 buf 数组中已使用字节的数量 4 // 等于 sds 所保存字符串的长度 5 int len; 6 7 // 记录 buf 数组中未使用字节的数量 8 int free; 9 10 // 字节数组,用于保存字符串 11 char buf[]; 12 13 };
这里注意一下。c语言的char是占一个字节的。不像java的char占两个字节。也就是只有八位,-127 - 128。
sds相比于c字符串的优势
1. 常数复杂度获取字符串长度
- 这个比较好理解,因为sds里面有一个字段为len,可以直接获取长度
2. 减少修改字符串时带来的内存重分配次数
- 因为传统的c字符串,不会自动扩容。而且其内存大小就等于字符串长度+1,因此,每修改一次字符串,都要重新分配一次内存,非常的耗费时间
- sds会自动扩容,并且会进行空间预分配。比如现在有一个hello的字符串。内存的大小可能是hello的两倍,也就是 5 * 2 = 10。当再次扩容字符串的时候,不一定需要再次分配内存了。并且可以自动扩容,假设10不够了,加了一个字符串后大小为13,那么内存就会分配为 13 * 2 = 26大小的内存。
3. 二进制安全,以及可以保存空字符
- c 字符串中的字符必须符合某种编码(比如 ascii), 并且除了字符串的末尾之外, 字符串里面不能包含空字符, 否则最先被程序读入的空字符将被误认为是字符串结尾 —— 这些限制使得 c 字符串只能保存文本数据, 而不能保存像图片、音频、视频、压缩文件这样的二进制数据。
- 因此,所有 sds api 都会以处理二进制的方式来处理 sds 存放在
buf
数组里的数据 - 也就是保存在buf数组里面的所有东西,不论英文中文,还是图片音频,都是二进制数据流。
上一篇: 秦仲:周朝诸侯国秦国国君,他的一生有着怎样的经历?
下一篇: Mysql—表数据之增删改