当前位置: 代码网 > it编程>数据库>Redis > Redis系列之底层数据结构SDS详解

Redis系列之底层数据结构SDS详解

2024年11月25日 Redis 我要评论
实验的环境redis 6.0vscode 1.88.1什么是sds?sds:simple dynamic string,翻译为简单动态字符串。sds是一种用于存储二进制数据的数据结构,具有动态扩容的特

实验的环境

  • redis 6.0
  • vscode 1.88.1

什么是sds?

sds:simple dynamic string,翻译为简单动态字符串。

sds是一种用于存储二进制数据的数据结构,具有动态扩容的特点,代码位于src/sds.hsrc/sds.c

sds的总体数据结构大致如图:在源码里sds包括几个部分,lenallocflagsbuf,其中 sdshdr是头部,buf是真实存储数据的地方,在存储的数据后面会跟一个\0,所以数据加上\0就是所谓的buf

  • len:保存了sds字符串的长度
  • buf[]:保存数据的地方
  • alloc:分别以uint8, uint16, uint32, uint64表示整个sds
  • flags:始终为一字节, 以低三位标示着头部的类型, 高5位未使用

查看源码sds.h,可以看到sds里面有几种不同的头部,其中sdshdr5实际并未使用到,所以实际上有四种不同的头部

/* note: sdshdr5 is never used, we just access the flags byte directly.
 * however is here to document the layout of type 5 sds strings. */
struct __attribute__ ((__packed__)) sdshdr5 {
    unsigned char flags; /* 3 lsb of type, and 5 msb of string length */
    char buf[];
};
struct __attribute__ ((__packed__)) sdshdr8 {
    uint8_t len; /* used */
    uint8_t alloc; /* excluding the header and null terminator */
    unsigned char flags; /* 3 lsb of type, 5 unused bits */
    char buf[];
};
struct __attribute__ ((__packed__)) sdshdr16 {
    uint16_t len; /* used */
    uint16_t alloc; /* excluding the header and null terminator */
    unsigned char flags; /* 3 lsb of type, 5 unused bits */
    char buf[];
};
struct __attribute__ ((__packed__)) sdshdr32 {
    uint32_t len; /* used */
    uint32_t alloc; /* excluding the header and null terminator */
    unsigned char flags; /* 3 lsb of type, 5 unused bits */
    char buf[];
};
struct __attribute__ ((__packed__)) sdshdr64 {
    uint64_t len; /* used */
    uint64_t alloc; /* excluding the header and null terminator */
    unsigned char flags; /* 3 lsb of type, 5 unused bits */
    char buf[];
};

为什么要使用sds?

redis是用c语言写的,为什么不直接就用c语言里的char来定义字符串?

获取字符串长度

由于有len属性,所以获取sds字符串的长度只需要读取len属性,所以时间复杂度为o(1)

如果直接使用c语言中的字符串来实现,获取字符串的长度需要遍历计数,时间复杂度为o(n)

避免缓存区溢出

c语言中,如果使用strcat函数来进行两个字符串的拼接,如果没有分配足够长度的内存空间,就会造成缓存区溢出。

而对于sds数据类型,在进行字符串修改的时候,会根据记录的len属性检查内存空间是否满足需求,如果不满足,会进行相应空间的扩展,所以不会出现缓存区溢出

减少字符串内存重新分配次数

c语言中字符串,是不会记录字符串的长度的,所以一旦修改了字符串,就需要重新分配内存,因为如果没有重新分配,字符串长度增大时会造成内存溢出区溢出,长度减小时会造成内存泄漏。

而对于sds来说,因为有长度熟悉lenalloc属性的存在,sds实现了空间预分配惰性空间释放两种策略来减少重新分配内存

  1. 空间预分配:sds对空间进行扩展的时候,扩展的内存比实际需要的多,这样可以减少字符串增长操作所需的内存重新分配次数
  2. 惰性空间释放:sds对字符串进行缩短操作时,不会立即进行内存重新分配,来回收缩短后多余的内存空间,而是使用alloc将这些字节数量记录下来,等待后续使用

二进制安全

c语言中,是以空字符串作为字符串结束的标识,但是一些特殊的字符串,可能就包括空字符串的,所以容易丢失数据,不能正确存取。

而sds是根据len属性,以处理二进制的方式来处理buf里的数据,所以保存数据更加安全

兼容部分c字符串函数

sds可以重用c语言库<string.h>中的一部分函数

c字符串和sds对比

c字符串sds
获取字符串长度时间复杂度为o(n)获取字符串的长度时间复杂度为o(1)
不安全,可能会造成缓冲区溢出安全,不会造成缓冲区溢出
修改字符串n次就需要进行n次内存分配修改字符串长度n次,最多需要n次内存分配
只能保存文本数据可以保存文本数据或者二进制数据
可以使用所有<string.h>库中的函数可以使用一部分<string.h>库中的函数

总结

以上为个人经验,希望能给大家一个参考,也希望大家多多支持代码网。

(0)

相关文章:

  • Redis数据一致性详解

    1、一致性一致性是指系统中各节点数据保持一致。分布式系统中,可以理解为多个节点中的数据是一致的。一致性根据严苛程度分类:强一致性:写进去的数据是什么,读出来的数据就是什么,对性能影…

    2024年11月15日 数据库
  • 为Redis设置密码的三种方法

    为Redis设置密码的三种方法

    前言redis 是一个高性能的键值对数据库,广泛应用于缓存、消息队列等场景。为了保障 redis 服务的安全性,设置密码认证是非常重要的一步。方法一:通过编辑配... [阅读全文]
  • 使用Redis实现数据库对象自增ID的方法

    使用Redis实现数据库对象自增ID的方法

    在分布式项目中,数据表的主键id一般可能存在于uuid或自增id这两种形式,uuid好理解而且实现起来也最容易,但是缺点就是数据表中的主键id是32位的字符串,... [阅读全文]
  • RedisTemplate序列化设置的流程和具体步骤

    RedisTemplate序列化设置的流程和具体步骤

    流程概述下面是整个 redistemplate 序列化设置的流程图:具体步骤1. 创建 redistemplate 实例首先,我们需要创建一个 redistem... [阅读全文]
  • 基于Redis实现API接口访问次数限制

    一,概述日常开发中会有一个常见的需求,需要限制接口在单位时间内的访问次数,比如说某个免费的接口限制单个ip一分钟内只能访问5次。该怎么实现呢,通常大家都会想到用redis,确实通过…

    2024年11月13日 数据库
  • Redis主从复制的实现示例

    Redis主从复制的实现示例

    redis 主从复制主从复制是高可用redis的基础,哨兵和集群都是在主从复制基础上实现高可用的。主从复制主要实现了数据的多机备份,以及对于读操作的负载均衡和简... [阅读全文]

版权声明:本文内容由互联网用户贡献,该文观点仅代表作者本人。本站仅提供信息存储服务,不拥有所有权,不承担相关法律责任。 如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 2386932994@qq.com 举报,一经查实将立刻删除。

发表评论

验证码:
Copyright © 2017-2025  代码网 保留所有权利. 粤ICP备2024248653号
站长QQ:2386932994 | 联系邮箱:2386932994@qq.com