当前位置：首页 > news >正文

【C++】封装哈希表实现 unordered_map、unordered_set

news 2025/10/30 13:50:16

文章目录

封装哈希表实现 `unordered_map`、`unordered_set`
- 1. 如何复用前面写过的哈希表？
- 1.1 `unordered_map` 的结构
- 1.2 `unordered_set` 的结构
- 2. 容器支持 insert
- 3. 迭代器的支持
- - 3.1 实现哈希表的迭代器
  - 3.2 `unordered_map` 的迭代器实现
  - 3.3 `unordered_set` 的迭代器实现
- 4. `unordered_map` 支持 []

封装哈希表实现 `unordered_map`、`unordered_set`

在前面我们已经讲过 unordered_map、unordered_set 这两种容器，又讲了哈希表的实现。这次就通过封装哈希表实现 unordered_map、unordered_set。

我们知道哈希表有两种处理冲突的策略，分别是：开放寻址法、链地址法（也称哈希桶，我自己习惯叫这个，下面也用这个叫法了）。个人认为哈希桶的实现更为简单，所以下面的讲解是封装哈希桶来实现的。

因为封装 unordered_map、unordered_set 的操作和前面的封装 map、set 比较相似你，感兴趣的也可以去看看我前面写的: 封装红黑树实现 mymap、myset

1. 如何复用前面写过的哈希表？

前面我实现哈希表的时候，采用的是 K，V 结构的模板参数，但是这样实现的话就等于写死了。我们只能通过封装 K，V 结构的哈希表去实现 unordered_map，而想要实现 unordered_set的话，我们还需要写一个代码高度相似的 K 结构的哈希表。这在步骤上明显比较繁琐，而且后续维护也不方便。那有没有方法能够解决这种高度相似的代码问题呢？使用模板！

我们都知道，不管是 unordered_map 还是 unordered_set 它们都共同拥有着一个键 K，只不过 unordered_map 的值是额外的 V，而 unordered_set 的值就是它的键 K。所以我们可以这么设计，第一个模板参数仍为 K，用于保存哈希表的键，但是第二个参数 T 用于保存哈希表实际存储的数据（unordered_map 就传一个 pair<K, V> 给模板参数 T，而 unordered_set 就传一个 K 给模板参数 T，这样就能让编译器自动为我们生成两套底层存储数据不同的哈希表）。因为底层存储数据类型不同，所以我们还需要一个模板参数 KeyOfT 去统一我们对数据的读取和使用。

	// 修改前template<class K, class V>struct HashNode{pair<K, V> _kv;HashNode<K, V>* _next;HashNode(const pair<K, V>& kv):_kv(kv), _next(nullptr){}};template<class K, class V, class Hash = HashFunc<K>>class HashTable{typedef HashNode<K, V> Node;public:HashTable():_tables(__stl_next_prime(0)), _n(0){}private:vector<Node*> _tables; // 指针数组size_t _n = 0;		   // 表中存储数据个数}// 修改后template<class T>struct HashNode{T _data;HashNode<T>* _next;HashNode(const T& data):_data(data), _next(nullptr){}};template<class K, class T, class KeyOfT, class Hash>class HashTable{typedef HashNode<T> Node;public:HashTable():_tables(__stl_next_prime(0)), _n(0){}private:vector<Node*> _tables; // 指针数组size_t _n = 0;		  // 表中存储数据个数};

KeyOfT 的作用
前面我们说过，KeyOfT 是用来统一我们对数据的读取和使用的，其实这玩意就是相当于传一个仿函数，unordered_map 的话就返回 kv.first，而 unordered_set 的话就直接返回 key。

1.1 `unordered_map` 的结构

底层存储的就是一个哈希表，但是我们前面说了，它的第一个模板参数为 K，第二个模板参数用于存储他真正的数据，所以为 pair<const K, V>。

template<class K, class V, class Hash = HashFunc<K>>
class unordered_map
{struct MapKeyOfT{const K& operator()(const pair<K, V>& kv){return kv.first;}};private:hash_bucket::HashTable<K, pair<const K, V>, MapKeyOfT, Hash> _ht;
};

1.2 `unordered_set` 的结构

和 unordered_map 最本质的区别就是它底层存储的哈希表中存储的数据是 K 而非 pair<K, V>。

	template<class K, class Hash = HashFunc<K>>class unordered_set{struct SetKeyOfT{const K& operator()(const K& key){return key;}};private:hash_bucket::HashTable<K, const K, SetKeyOfT, Hash> _ht;};

2. 容器支持 insert

直接在容器中通过调用底层接口的 Insert 即可。

		// unordered_mapbool insert(const pair<K, V>& kv){return _ht.Insert(kv);}// unordered_setbool insert(const K& key){return _ht.Insert(key);}

3. 迭代器的支持

我们这里所说的 unordered_map、unordered_set 其实就是一层壳，我们是通过外边这层壳对底层数据结构的操作进行统一。实现这层壳主要还是调用底层接口，所以我们得先实现底层数据结构哈希表的迭代器。

3.1 实现哈希表的迭代器

我们这个哈希表是通过哈希桶的方式来实现的，所以迭代器得存储两个数据。一个是哈希表的表（你是在这个表里面通过哈希值找桶），一个是当前节点的指针（在找到桶之后，你得记录你是在桶中链表的哪一个节点）。

我们迭代器的实现方法仍然和之前实现迭代器的方法一样，使用 <T, Ref, Ptr> 形式，这样可以在要使用的地方通过传普通类型和 const类型来让编译器为我们生成普通迭代器和 const 迭代器。

注意：
因为我们一般迭代器的实现是放在数据结构前面的，而这里的迭代器又要存储哈希表，所以要迭代器前面先声明哈希表。

	// 前置声明template<class K, class T, class KeyOfT, class Hash>class HashTable;template<class K, class T, class Ref, class Ptr, class KeyOfT, class Hash>struct HTIterator{typedef HashNode<T> Node;typedef HashTable<K, T, KeyOfT, Hash> HT;typedef HTIterator<K, T, Ref, Ptr, KeyOfT, Hash> Self;Node* _node;const HT* _ht;HTIterator(Node* node, const HT* ht):_node(node), _ht(ht){}};

又因为我们这里的迭代器是要访问哈希表中的数据的，而哈希表中的数据又是私有的，所以在哈希表类中还得做一下友元声明。

		// 在哈希表类中做下友元声明template<class K, class T, class Ref, class Ptr, class KeyOfT, class Hash>friend struct HTIterator;

operator*、operator->、operator!=的实现大家应该都挺熟的了，这里只讲解一下 operator++ 的实现，以便于支持范围for循环，operator-- 的思路和 ++ 刚好相反，这里就不实现了，感兴趣的自己去实现一下。

因为是哈希桶的实现，所以数据处于哈希表的桶中。如果节点所在的桶后面还有数据的话，直接通过链表指针走到该桶的下一个节点即可；如果桶后面没有数据的话，也就是说这个桶走完了，那么我们就要走到哈希表中下一个不为空的桶中开始找，下一个节点就是那个桶上挂的第一个节点。

那么如何表示走到 end 位置呢？因为我们是用节点指针表示当前节点，那么很自然的想到 end 位置应该是 nullptr。所以当 hashi 的大小等于哈希桶的数量时，直接给迭代器赋值为 nullptr

		Ref operator*(){return _node->_data;}Ptr operator->(){return &_node->_data;}bool operator!=(const Self& s){return _node != s._node;}Self& operator++(){if (_node->_next){// 当前桶还有数据，走到桶的下一个节点_node = _node->_next;}else{// 当前桶走完了，走到下一个不为空的桶KeyOfT kot;Hash hash;// 计算当前桶的哈希值size_t hashi = hash(kot(_node->_data)) % _ht->_tables.size();++hashi;while (hashi < _ht->_tables.size()){_node = _ht->_tables[hashi];if (_node)break;else++hashi;}// 所有桶都走完了，end()给的空标识的_nodeif (hashi == _ht->_tables.size()){_node = nullptr;}}return *this;}

3.2 `unordered_map` 的迭代器实现

先通过传参定义迭代器，再通过调用底层接口封装成容器接口。

	template<class K, class V, class Hash = HashFunc<K>>class unordered_map{struct MapKeyOfT{const K& operator()(const pair<K, V>& kv){return kv.first;}};public:typedef typename hash_bucket::HashTable<K, pair<const K, V>, MapKeyOfT, Hash>::Iterator iterator;typedef typename hash_bucket::HashTable<K, pair<const K, V>, MapKeyOfT, Hash>::ConstIterator const_iterator;iterator begin(){return _ht.Begin();}iterator end(){return _ht.End();}const_iterator begin() const{return _ht.Begin();}const_iterator end() const{return _ht.End();}bool insert(const pair<K, V>& kv){return _ht.Insert(kv);}iterator Find(const K& key){return _ht.Find(key);}bool Erase(const K& key){return _ht.Erase(key);}private:hash_bucket::HashTable<K, pair<const K, V>, MapKeyOfT, Hash> _ht;};

3.3 `unordered_set` 的迭代器实现

先通过传参定义迭代器，再通过调用底层接口封装成容器接口。

	template<class K, class Hash = HashFunc<K>>class unordered_set{struct SetKeyOfT{const K& operator()(const K& key){return key;}};public:typedef typename hash_bucket::HashTable<K, const K, SetKeyOfT, Hash>::Iterator iterator;typedef typename hash_bucket::HashTable<K, const K, SetKeyOfT, Hash>::ConstIterator const_iterator;iterator begin(){return _ht.Begin();}iterator end(){return _ht.End();}const_iterator begin() const{return _ht.Begin();}const_iterator end() const{return _ht.End();}bool insert(const K& key){return _ht.Insert(key);}iterator Find(const K& key){return _ht.Find(key);}bool Erase(const K& key){return _ht.Erase(key);}private:hash_bucket::HashTable<K, const K, SetKeyOfT, Hash> _ht;};

4. `unordered_map` 支持 []

要支持 unordered_map 的 []，主要需要修改 insert 返回值，将 HashTable中 insert 的返回值修改为 pair<Iterator, bool> Insert(const T& data)。

		pair<Iterator, bool> Insert(const T& data){KeyOfT kot;Iterator it = Find(kot(data));if (it != End())return { it, false };Hash hash;// 负载因子 == 1 时扩容if (_n == _tables.size()){vector<Node*> newTable(_tables.size() * 2);for (size_t i = 0; i < _tables.size(); ++i){Node* cur = _tables[i];while (cur){Node* next = cur->_next;// 头插到新标size_t hashi = hash(kot(cur->_data)) % newTable.size();cur->_next = newTable[hashi];newTable[hashi] = cur;cur = next;}_tables[i] = nullptr;}_tables.swap(newTable);}size_t hashi = hash(kot(data)) % _tables.size();// 头插Node* newnode = new Node(data);newnode->_next = _tables[hashi];_tables[hashi] = newnode;++_n;return  { Iterator(newnode, this), false };}

统一 unordered_map、unordered_set 中 insert 接口：

		// unordered_mappair<iterator, bool> insert(const pair<K, V>& kv){return _ht.Insert(kv);}// unordered_setpair<iterator, bool> insert(const K& key){return _ht.Insert(key);}

最后在 unordered_map 中实现 operator[]

		V& operator[](const K& key){pair<iterator, bool> ret = insert({ key, V() });return ret.first->second;}

查看全文

http://www.dtcms.com/a/216467.html

算力中心：数字经济发展的新引擎

在 Linux 系统上连接 GitHub 的方法 (适用2025年)

Git安装后配置Gitee发现C盘下无.ssh

git 命令之-git cherry-pick

【Webtrees 手册】第 9 章 - 开发指南

SOC-ESP32S3部分：15-PWM脉冲宽度调制

赋能低空经济 | 奇妙智能已掌握AI+无人机智慧巡检技术

浅谈Mysql的MVCC机制（RC与RR隔离级别）

定时清理流媒体服务器录像自动化bash脚本

为My Retro应用添加安全防护

线程池详解：原理、使用与优化

机器学习算法-- K 近邻算法（KNN）

关于空调温度控制仿真模型的详细技术文档，包含数学模型、Python实现和系统分析

丰富案例库：解锁智能门锁行业唯创语音交互方案的应用优势

小土堆pytorch--现有网络模型的使用及修改

在PyTorch中，有了y = x + y，为什么还需要y += x，有什么好处呢？

cursor使用mcp

基于Matlab实现各种光谱数据预处理

数据库相关问题

工控安全审计与网络流量监控系统的协同防御

字节跳动推出开源多模态模型 BAGEL 从图像生成到世界建模

Solana账户创建与Rust实践全攻略

什么是Windows内存压缩? win10/11系统启用和禁用内存压缩的教程

图标变白，开始菜单栏无法打开程序（以jupyter为例）

让jupyter notebook显示目录

Lua中的`self`参数：揭秘隐藏的“对象上下文”

Word 目录自动换行后错位与页码对齐问题解决教程

Spring Security Token 认证原理

AG32 DMAC实现内部MCU与FPGA通信【知识库】

智慧康养护理：科技重塑老龄化社会的健康守护体系

文章目录

封装哈希表实现 unordered_map、unordered_set

1. 如何复用前面写过的哈希表？

1.1 unordered_map 的结构

1.2 unordered_set 的结构

2. 容器支持 insert

3. 迭代器的支持

3.1 实现哈希表的迭代器

3.2 unordered_map 的迭代器实现

3.3 unordered_set 的迭代器实现

4. unordered_map 支持 []