聊一聊Redis之数据结构

基本数据结构简单动态字符串redis中的字符串使用“简单动态字符串”(SDS)表示,无论是字符串值还是键底层都采用“简单动态字符串” 。
 

聊一聊Redis之数据结构

文章插图
 
 
  • free:未使用空间大小;
  • len:字符串长度;
  • buf:以空字符结尾的char数组 。
为了减少内存重新分配次数,SDS做出了以下优化:
  • 空间预分配:额外分配的未使用空间数量由以下公式决定: 如果对SDS进行修改之后,SDS的长小于1MB,那么程序分配和len 属性同样大小的未使用空间,如果对SDS进行修改之后,SDS的长度将大于等千1MB, 那么程序会分配 1MB 的未使用空间 。
  • 惰性空间释放:程序并不立即使用内存重分配来回收缩短后多出来的字节,而是使用free属性将这些字节的数量记录起来,并等待将来使用 。
链表链表是Redis列表键实现之一,也是很多其他功能实现的基础,链表节点定义如下:
 
聊一聊Redis之数据结构

文章插图
 
 
链表的完整结构体定义如下
 
聊一聊Redis之数据结构

文章插图
 
 
  • head为表头指针;
  • tail为表尾指针;
  • len为链表长度计数器;
  • dup为函数指针,用于复制链表节点所保存的值;
  • free为函数指针,用于释放链表节点所保存的值;
  • match为函数指针,则用于对比链表节点所保存的值和另一个输入值是否相等 。
字典字典将键和值进行关联,当哈希键中的键值对数量比较多,或者键值对中的元素比较大的时候,采用字典作为底层实现 。字节的数据结构如下
【聊一聊Redis之数据结构】 
聊一聊Redis之数据结构

文章插图
 
 
哈希表结构dict中,table属性是一个数组,每个元素都是指向dictEntry结构的指针,size属性记录了哈希表的大小,sizemask属性的值总是等于size-1,而used属性则记录了哈希表目前已有节点(键值对)的数量 。
字典结构dictType中有两个哈希表ht[0]和ht[1],ht[l]哈希表只会在对 ht[0]哈希表进行rehash时使用,rehashidx它记录了rehash目前的进度 。type属性是一个指向dictType结构的指针,dictType结构保存了一簇用于操作特定类型键值对的函数,例如计算哈希值、复制键、复制值、对比键、销毁键和销毁值的函数 。而privdata属性则保存了需要传给那些类型特定函数的可选参数 。
为了让哈希表的负载因子维持在一个合理的范围之内,当哈希表保存的键值对数量太多或者太少时,程序需要对哈希表的大小进行相应的扩展或者收缩 。
  • 如果执行的是扩展操作,那么ht[l]的大小为第一个大于等于ht[0].used*2的;
  • 如果执行的是收缩操作,那么ht[1]的大小为第一个大于等于ht[O].used的 。
字典采用渐进式rehash,好处在千它采取分而治之的方式,将 rehash键值对所需的计算工作均摊到对字典的每个添加、删除、查找和更新操作上 。
跳跃表跳跃表可以用于有序集合键的底层实现,数据结构如下
 
聊一聊Redis之数据结构

文章插图
 
 
zskiplist结构包含以下属性:
  • header: 指向跳跃表的表头节点 。
  • tail: 指向跳跃表的表尾节点 。
  • level: 记录目前跳跃表内,层数最大的那个节点的层数 。
  • length: 记录跳跃表的长度 。
zskiplistNode 结构,该结构包含以下属性:
  • 层 (level) : 每个层都带有两个属性:前进指针和跨度 。前进指针用于 访问位于表尾方向的其他节点,而跨度则记录了前进指针所指向节点和当前节点的 距离 。
  • 后退 (backward) 指针:指向位于当前节点的前一个节点 。
  • 分值 (score): 节点按各自所保存的分值从小到大排列 。
  • 成员对象 (obj): 节点所保存的成员对象 。
整数集合当一个集合只包含整数值元素,并且这个集合的元素数董不多时,Redis 就会使用整数集合作为集合键的底层实现 。
 
聊一聊Redis之数据结构

文章插图
 
contents数组是整数集合的底层数据存放位置,各个项在数组中按值的大小从小到大有序地排列,并且数组中不包含任何重复项 。length属性记录了整数集合包含的元素数量,encoding属性决定了整数类型(INTSET_ENC_INT16/INTSET_ENC_INT32/INTSET_ENC_INT64) 。新元素的类型比整数集合现有所有元素的类型都要长时,整数集合需要先进行升级 。


推荐阅读