当前位置: 首页 > news >正文

【Redis】哈希表结构

目录

  • 1、背景
  • 2、哈希表
    • 【1】底层结构
    • 【2】哈希冲突
    • 【3】链地址法
    • 【4】传统rehash
    • 【5】渐进式rehash
    • 【6】rehash触发条件
    • 【7】特性

1、背景

redis中的hashtable(哈希表)是一种高效的键值对存储结构,主要用于实现redis的字典类型,接下来就来讲解一下hashtable(redis版本6.2.18)的底层实现。

2、哈希表

【1】底层结构

hashtable主要包含以下结构体,dict-字典结构:

typedef struct dict {dictType *type; //类型特定函数void *privdata; //私有数据dictht ht[2]; //哈希表数组(两个,用于rehash)long rehashidx; //rehash索引,-1表示不在rehashint16_t pauserehash; //如果>0代表rehash暂停(<0表示编码错误)
} dict;

dictht-哈希表结构:

typedef struct dictht {dictEntry **table; //哈希表数组unsigned long size; //哈希表大小unsigned long sizemask; //哈希表大小掩码,用于计算索引值 unsigned long used; //哈希表已有节点数量
} dictht;

dictEntry-哈希表节点,头节点叫哈希桶:

typedef struct dictEntry {void *key; //键union {void *val;uint64_t u64;int64_t s64;double d;} v; //值struct dictEntry *next; //指向下个哈希表节点,形成链表
} dictEntry;

【2】哈希冲突

在redis的hashtable实现中,哈希冲突发生在两个或多个不同的键(key)被哈希函数映射到同一个哈希桶(bucket)的情况。这种情况是不可避免的,因为:

1、哈希函数的输出空间(哈希值范围)通常小于输入空间(可能的键数量)
2、即使有完美的哈希函数,在实际应用中内存也是有限的

【3】链地址法

redis采用链地址法来处理哈希冲突,链地址法的实现如下:

1、每个哈希桶实际上是一个单向链表的头指针
2、当发生冲突时,新的键值对会被添加到对应桶的链表中
3、查找时需要遍历链表来找到匹配的键

冲突处理流程如下分为三类,插入操作流程如下:

<1>插入操作流程

1、计算键的哈希值
2、通过哈希值确定桶位置
3、将新节点插入到链表头部(时间复杂度O(1)

<2>查找操作流程

1、计算键的哈希值
2、定位到对应的桶
3、遍历链表查找匹配的键

<3>删除操作流程

1、类似查找过程,找到节点后从链表中移除

【4】传统rehash

链地址法虽然能解决hash冲突,但是当链表越来越长的时候,查询速度也会越来越慢了,毕竟查询时间复杂度为O(n)。所以就需要rehash,rehash是哈希表在扩容或缩容时重新分配所有键值对到新哈希表的过程。传统的一次性rehash方式会一次性将所有键值对从旧表迁移到新表,这会导致:

1、内存占用翻倍(需要同时维护新旧两个表)
2、迁移过程可能阻塞服务(对于大哈希表)
3、响应时间不稳定

【5】渐进式rehash

redis采用渐进式rehash来解决传统rehash问题,核心思想是将rehash过程分摊到多个操作中完成,渐进式rehash的实现机制如下:

<1>使用双表结构:

typedef struct dict {dictht ht[2]; //两个哈希表,ht[0]是主表,h[1]是rehash目标表long rehashidx; //rehash进度索引,-1表示未进行rehash
} dict;

<2>触发条件满足时:

1、分配新的哈希表ht[1]
2、设置rehashidx = 0,开始rehash过程

<3>逐步迁移:

1、每次对字典的增删改查操作时,除了执行指定操作外,还会将ht[0]的rehashidx位置上的所有键值对迁移到ht[1]
2、迁移完成后rehashidx++

<4>完成条件:

1、当ht[0]的所有键值对都迁移到ht[1]2、释放ht[0],将ht[1]设置为新的ht[0]
3、重置rehashidx = -1

渐进性rehash的访问逻辑如下:

<1>查找操作:

1、现在h[0]查找
2、如果没找到且正在rehash,再到ht[1]查找

<2>插入操作:

1、新键值对只插入到ht[1]
2、保证ht[0]只减不增

<3>删除/更新操作

1、同时在两个表中操作

【6】rehash触发条件

redis的哈希表在以下两种情况会触发rehash:

1、扩容条件:当负载因子(哈希表已使用的节点数量/哈希表大小)> 1时,且服务器没有执行RDB快照或AOF重写
2、缩容条件:负载因子 < 0.1时

【7】特性

hashtable的特性如下:

特性说明
数据结构采用链式哈希表(数组 + 链表结构)
冲突解决链地址法
哈希函数针对不同键类型(字符串、整数等)使用优化后的哈希算法
动态扩容负载因子 > 1且没执行RDB和AOF
渐进式rehash扩容/缩容时逐步迁移数据,避免阻塞服务
双哈希表维护ht[0](主表)和ht[1](rehash目标表)
缩容机制负载因子 < 0.1
内存效率通过渐进式rehash减少内存峰值占用
线程安全依赖redis单线程模型保证原子性操作
时间复杂度平均O(1)查找/插入/删除(理想情况)
多态支持通过dictType结构支持不同数据类型的键值操作

相关文章:

  • 网络学习中通信方面的相关知识、及再次解读B=2W
  • 大语言模型 14 - Manus 超强智能体 开源版本 OpenManus 上手指南
  • Kruise Rollout金丝雀发布
  • 《棒球知识百科》亚冬会有哪些国家参加·棒球1号位
  • [luogu12541] [APIO2025] Hack! - 交互 - 构造 - 数论 - BSGS
  • 今日行情明日机会——20250520
  • AI换商品背景:电商摄影降本增效的解决方案
  • IEEE Journal on Selected Areas in Communications 2025年1-5月论文速览
  • 苍穹外卖系统结构与功能报告
  • 算法训练之分治(快速排序)
  • 【数据库】-1 mysql 的安装
  • 一、Singal Tap 观察reg信号和wire信号
  • ubuntu14.04/16.06 安装vscode(实测可以用)
  • 注意力机制概念
  • mbed驱动st7789屏幕-硬件选择及连接(1)
  • power BI 倒计时+插件HTML Content,实现更新倒计时看板!
  • Java转Go日记(四十二):错误处理
  • 使用ZYNQ芯片和LVGL框架实现用户高刷新UI设计系列教程(第十三讲)
  • 文献解读:LigandMPNN
  • CHI中ordering的抽象
  • 上海婚登人聂晶:见证爱情故事开启,也向长久婚姻致敬
  • 破题“省会担当”,南京如何走好自己的路?
  • 全国35城居民对公共服务满意度“打分”,上海多项指标居首
  • 研究显示:肺活量衰减始于20至25岁
  • 前四月国家铁路发送货物12.99亿吨,同比增长3.6%
  • 上海银行副行长汪明履新上海农商银行党委副书记