【底层机制】std::unordered_map 扩容机制
底层机制相关推荐阅读:
【C++基础知识】深入剖析C和C++在内存分配上的区别]
【底层机制】【C++】vector 为什么等到满了才扩容而不是提前扩容?
【底层机制】malloc 在实现时为什么要对大小内存采取不同策略?
【底层机制】剖析 brk 和 sbrk的底层原理
【底层机制】为什么栈的内存分配比堆快?
【底层机制】右值引用是什么?为什么要引入右值引用?
【底层机制】auto 关键字的底层实现机制
正文如下:
我们将从为什么需要扩容、如何触发扩容、扩容的具体步骤以及如何优化四个方面来详细讲解。
一、核心概念:为什么需要扩容?
std::unordered_map
是一个基于哈希表实现的关联容器。其理想的查找、插入、删除时间复杂度是 O(1)。实现这一目标的关键在于:
- 哈希函数 (Hash Function):将键(Key)均匀地映射到一个大的数值空间。
- 桶数组 (Bucket Array):一个连续的内存块,每个位置是一个“桶”(Bucket),是链表的头节点或树的根节点(在冲突严重时)。
- 解决冲突:通常采用链地址法(Separate Chaining),即同一个桶内的元素以一个链表存储。
问题在于:如果键值对的数量(size()
)不断增加,而桶的数量(bucket_count()
)保持不变,会导致每个桶后面的链表变得越来越长。这样,操作的效率就会从 O(1) 退化为 O(n),失去了哈希表的优势。
解决方案:当键值对数量与桶数量的比值(即负载因子 Load Factor)超过某个阈值时,对桶数组进行扩容(Rehashing),即创建一个更大的新桶数组,然后将所有已有的键值对重新哈希到新数组中。
二、触发条件:何时进行扩容?
扩容的触发由一个关键参数控制:最大负载因子 (max_load_factor
),其默认值通常是 1.0
。
触发条件可以用一个简单的公式表示:
if (load_factor() > max_load_factor()) { rehash(); }
其中:
- 当前负载因子 (
load_factor()
)