源码角度解析 --- HashMap 的 get 和 put 流程
引言
在Java编程中,HashMap是一种常见的数据结构,用于存储键值对(key-value)。HashMap提供了高效的插入、删除和查找操作,是许多应用程序的核心组件。
我们知道,HashMap是用于存储key-value键值对的集合,而key-value键值对结构是基于Map中的Entry接口实现的,所以每一个键值对也可以称为Entry。这些键值对存放在HashMap的一个数组中,这个数组是HashMap的核心部分,数组的每个位置也被称为桶。当然,HashMap的底层结构不止是数组这么简单。
在JDK8之前,HashMap的底层结构是数组+链表的结构,数组的每一个位置存放的是一条链表。从JDK8开始,HashMap的底层结构却变成了数组+链表+红黑树的结构,基本结构如下图所示。
- 数组:也称为哈希桶(Bucket),每个元素是一个链表或红黑树的头节点;
- 链表:当哈希冲突发生时,元素会以链表形式连接在对应桶的位置;
- 红黑树:当链表长度超过 8 且数组长度超过 64 时,链表会转换为红黑树,提高查询效率。
下面我们将从源码角度入手了解HashMap中get和put操作的流程。
1.get操作
get
操作用于根据键查找对应的值。get
操作的步骤如下:
- 计算哈希值:使用哈希函数 hash() 计算键的哈希值。
- 确定索引:将哈希值映射到数组的索引位置。
(n - 1) & hash
定位数组位置。- 查找元素:在对应的桶中查找键值对。
- 检查头节点:直接比较第一个节点的 key 是否匹配。
- 红黑树查找:若头节点是红黑树节点,调用红黑树的
getTreeNode
方法。- 链表查找:遍历链表,逐个比较 key。
1.1 哈希函数计算哈希值
static final int hash(Object key) {int h;return (key == null) ? 0 : (h = key.hashCode()) ^ (h >>> 16);}
通过高 16 位与低 16 位异或,减少哈希冲突。
1.2 确定数组索引
// 1. 如果哈希表不为空且数组对应位置有元素if ((tab = table) != null && (n = tab.length) > 0 &&(first = tab[(n - 1) & hash]) != null) {}
(n - 1) & hash
定位数组位置:取余
本质是 取 hash
的低几位,位数由 n-1
的二进制长度决定。
假设数组长度 n = 16
(二进制 10000
),则 n-1 = 15
(二进制 01111
)。若 hash = 23
(二进制 10111
)。进行与运算:
hash: 0001 0111
n - 1: 0000 1111
-------------------
结果: 0000 0111 → 转换为十进制为 7
1.3 查找元素
// 2. 检查第一个节点是否是目标节点if (first.hash == hash && // always check first node((k = first.key) == key || (key != null && key.equals(k))))return first;// 3. 如果还有后续节点if ((e = first.next) != null) {// 3.1 如果是红黑树节点,调用红黑树的查找方法if (first instanceof TreeNode)return ((TreeNode<K,V>)first).getTreeNode(hash, key);// 3.2 否则遍历链表查找do {if (e.hash == hash &&((k = e.key) == key || (key != null && key.equals(k))))return e;} while ((e = e.next) != null);}
- 检查头节点:直接比较第一个节点的 key 是否匹配。
- 红黑树查找:若头节点是红黑树节点,调用红黑树的
getTreeNode
方法。- 链表查找:遍历链表,逐个比较 key。
get方法部分源码分析:
public V get(Object key) {Node<K,V> e;return (e = getNode(hash(key), key)) == null ? null : e.value;
}final Node<K,V> getNode(int hash, Object key) {Node<K,V>[] tab; Node<K,V> first, e; int n; K k;// 1. 如果哈希表不为空且数组对应位置有元素if ((tab = table) != null && (n = tab.length) > 0 &&(first = tab[(n - 1) & hash]) != null) {// 2. 检查第一个节点是否是目标节点if (first.hash == hash && // always check first node((k = first.key) == key || (key != null && key.equals(k))))return first;// 3. 如果还有后续节点if ((e = first.next) != null) {// 3.1 如果是红黑树节点,调用红黑树的查找方法if (first instanceof TreeNode)return ((TreeNode<K,V>)first).getTreeNode(hash, key);// 3.2 否则遍历链表查找do {if (e.hash == hash &&((k = e.key) == key || (key != null && key.equals(k))))return e;} while ((e = e.next) != null);}}// 4. 未找到,返回nullreturn null;
}
2. put操作
步骤:
- 计算哈希值:使用哈希函数 hash(key) 计算键的哈希值。
- 计算索引:将哈希值映射到数组的索引位置。
(n - 1) & hash
定位数组位置。- 插入或更新元素:在对应的桶中插入或更新键值对。
- 无冲突:直接在数组对应位置插入新节点。
- 链表冲突:遍历链表,若找到相同 key 则覆盖值,否则插入尾部;若链表长度达到 8 且数组长度 ≥ 64,转换为红黑树。
- 红黑树冲突:调用红黑树的插入方法。
- 扩容:如果若元素数量超过阈值(容量 × 负载因子),哈希表会进行扩容。
同get方法相似,前面不再赘述,这里从第三步介绍。
putVal方法
$$ putVal 方法首先检查数组是否为空,以及对应索引位置的桶是否为空。
// 1. 如果哈希表为空或长度为0,进行扩容if ((tab = table) == null || (n = tab.length) == 0)n = (tab = resize()).length;
$$ 如果桶为空,则直接插入新节点。
if ((p = tab[i = (n - 1) & hash]) == null)tab[i] = newNode(hash, key, value, null);
$$
如果桶的第一个节点匹配,则更新该节点的值。
如果桶是红黑树,则调用红黑树的插入方法。
如果桶是链表,则遍历链表查找匹配的节点,如果不存在则插入新节点。
如果链表长度超过阈值,则将链表转换为红黑树。
如果负载因子超过阈值,哈希表会进行扩容。
// 3. 如果该位置的第一个节点的key与待插入的key相同,记录该节点if (p.hash == hash &&((k = p.key) == key || (key != null && key.equals(k))))e = p;// 4. 如果该位置是红黑树节点,调用红黑树的插入方法else if (p instanceof TreeNode)e = ((TreeNode<K,V>)p).putTreeVal(this, tab, hash, key, value);else {// 5. 否则为链表结构,遍历链表for (int binCount = 0; ; ++binCount) {// 5.1 如果遍历到链表尾部,插入新节点if ((e = p.next) == null) {p.next = newNode(hash, key, value, null);// 如果链表长度达到树化阈值(8),转换为红黑树if (binCount >= TREEIFY_THRESHOLD - 1) // -1 for 1sttreeifyBin(tab, hash);break;}// 5.2 如果在链表中找到相同key的节点,结束遍历if (e.hash == hash &&((k = e.key) == key || (key != null && key.equals(k))))break;p = e;}}// 6. 如果找到已存在的key节点,根据onlyIfAbsent决定是否覆盖valueif (e != null) { // existing mapping for keyV oldValue = e.value;if (!onlyIfAbsent || oldValue == null)e.value = value;afterNodeAccess(e); // 回调方法,LinkedHashMap会用到return oldValue;}
put操作源码分析
public V put(K key, V value) {return putVal(hash(key), key, value, false, true);
}final V putVal(int hash, K key, V value, boolean onlyIfAbsent,boolean evict) {Node<K,V>[] tab; Node<K,V> p; int n, i;// 1. 如果哈希表为空或长度为0,进行扩容if ((tab = table) == null || (n = tab.length) == 0)n = (tab = resize()).length;// 2. 计算数组索引位置,如果该位置为空,直接插入新节点if ((p = tab[i = (n - 1) & hash]) == null)tab[i] = newNode(hash, key, value, null);else {Node<K,V> e; K k;// 3. 如果该位置的第一个节点的key与待插入的key相同,记录该节点if (p.hash == hash &&((k = p.key) == key || (key != null && key.equals(k))))e = p;// 4. 如果该位置是红黑树节点,调用红黑树的插入方法else if (p instanceof TreeNode)e = ((TreeNode<K,V>)p).putTreeVal(this, tab, hash, key, value);else {// 5. 否则为链表结构,遍历链表for (int binCount = 0; ; ++binCount) {// 5.1 如果遍历到链表尾部,插入新节点if ((e = p.next) == null) {p.next = newNode(hash, key, value, null);// 如果链表长度达到树化阈值(8),转换为红黑树if (binCount >= TREEIFY_THRESHOLD - 1) // -1 for 1sttreeifyBin(tab, hash);break;}// 5.2 如果在链表中找到相同key的节点,结束遍历if (e.hash == hash &&((k = e.key) == key || (key != null && key.equals(k))))break;p = e;}}// 6. 如果找到已存在的key节点,根据onlyIfAbsent决定是否覆盖valueif (e != null) { // existing mapping for keyV oldValue = e.value;if (!onlyIfAbsent || oldValue == null)e.value = value;afterNodeAccess(e); // 回调方法,LinkedHashMap会用到return oldValue;}}// 7. 记录结构修改次数++modCount;// 8. 如果元素数量超过阈值,进行扩容if (++size > threshold)resize();afterNodeInsertion(evict); // 回调方法,LinkedHashMap会用到return null;
}