集合专题之Map
一、Map介绍
以下是jkd8的内容,jdk11+略有更新
- Map与Collection并列存在。用于保存具有映射关系的数据:Key-Value
- Map中的 key和 value可以是任何引用类型的数据,会封装到HashMap$Node对象中
- Map中的 key不允许重复,原因和HashMap一样,后存入的 Key 会覆盖先前的 Value
- Map中的value可以重复
- Map的key可以为null,value也可以为null,注意key为null,只能有一个,value为null,可以多个
- 常用String类作为Map的key
- key和value之间存在单向一对一关系,即通过指定的key总能找到对应的value
- 一个 Key 对应多个 Value:
Map<K, List<V>>
- 哈希冲突:不同的 Key 可能计算得到相同的哈希值(哈希冲突),但同一个 Key 必须映射到同一个位置
- hashCode和equals只检查key
- 关于Node
class Node<K,V> {final int hash; // key的哈希值(经过扰动计算)final K key; // 键V value; // 值Node<K,V> next; // 链表的下一个节点 }
代码展示
Map map=newHashMap();map.put("no1", "韩顺平");//k-vmap.put("no2", "张无忌");//k-vmap.put("no1", "张三丰");//当有相同的 k , 就等价于替换.map.put("no3", "张三丰");//k-vmap.put(null, null); //k-vmap.put(null, "abc"); //等价替换
map.put("no4", null); //k-vmap.put("no5", null); //k-vmap.put(1, "赵敏");//k-vmap.put(new Object(), "金毛狮王");//k-v// 通过get 方法,传入 key,会返回对应的valueSystem.out.println(map.get("no2"));//张无忌
11.Map存放数据的key-value示意图,一对k-v是放在一个HashMap的Node中的,因为Node实现了Entry接口,有些书上也说一对k-v就是一个Entry (如图)
我们来看一下Node的源码,是我们HashMap的一个静态内部类
final int hash
存储的是 Key 的哈希码经过二次处理后的值
在EntrySet中,定义类型是Map.entry,但是实际上存放的还是hashmap的Node,因为Node实现了Map.entry的接口
展开例子讲解:
我们定义一个HashMap之后可以查看Set的类型,其实还是Node
为了方便程序员遍历,还创建了EntrySet集合。EntrySet集合存放的元素类型是Entry,而一个Entry对象就有k-v,也就是EntrySet<Map.Entry<k-v>>。实际上指向的还是Node的key-value
所以当我们把k-v(Node)==变成==>entry==存到==>EntrySet 之后就方便遍历 是因为提供了两个方法:
getKey()和getValue()
看看具体使用:
和我们之前谈到HashSet底层是HashMap,那这两个到底有什么关系,我们来对比一下:
结构 | HashMap 的链表 | HashSet 的链表(本质是 HashMap 的 Key 链表) |
---|---|---|
存储内容 | Node<K,V> (键值对) | Node<E, PRESENT> (Key 是元素,Value 是固定虚拟值) |
链表节点 | key, value, hash, next | element, PRESENT, hash, next (Value 无实际意义) |
HashMap 的 Value | HashSet 的 Value(虚拟值) | |
---|---|---|
存储与 Key 关联的数据 | 无实际意义,仅用于占位 |
二、Map体系图
三、Map接口方法
Map接口常用方法:
- put:添加
- remove:根据键删除映射关系
- get:根据键获取值
- size:获取元素个数
- isEmpty:判断个数是否为0
- clear:清除
- containsKey:查找键是否存在
四、Map遍历方法
- containsKey:查找键是否存在
- keySet:获取所有的键
- entrySet:获取所有关系k-v
- values:获取所有的值
三组遍历方法:
public class MapFor {public static void main(String[] args) {// 创建HashMap并添加数据Map map = new HashMap();map.put("邓超", "孙俪");map.put("王宝强", "马蓉");map.put("宋喆", "马蓉");map.put("刘令博", null);map.put(null, "刘亦菲");map.put("鹿晗", "关晓彤");// 第一组:通过keySet遍历Set keyset = map.keySet();// 方式1:增强for循环System.out.println("-----第一种方式(keySet+增强for)-------");for (Object key : keyset) {System.out.println(key + "-" + map.get(key));}// 方式2:迭代器System.out.println("-----第二种方式(keySet+迭代器)--------");Iterator iterator = keyset.iterator();while (iterator.hasNext()) {Object key = iterator.next();System.out.println(key + "-" + map.get(key));}// 第二组:通过values遍历Collection values = map.values();// 方式1:增强for循环System.out.println("-----第三种方式(values+增强for)-------");for (Object value : values) {System.out.println(value);}// 方式2:迭代器System.out.println("-----第四种方式(values+迭代器)--------");Iterator iterator2 = values.iterator();while (iterator2.hasNext()) {Object value = iterator2.next();System.out.println(value);}// 第三组:通过entrySet遍历Set entrySet = map.entrySet();// 方式1:增强for循环System.out.println("-----第五种方式(entrySet+增强for)-------");for (Object entry : entrySet) {Map.Entry m = (Map.Entry) entry;System.out.println(m.getKey() + "-" + m.getValue());}// 方式2:迭代器System.out.println("-----第六种方式(entrySet+迭代器)--------");Iterator iterator3 = entrySet.iterator();while (iterator3.hasNext()) {Map.Entry m = (Map.Entry) iterator3.next();System.out.println(m.getKey() + "-" + m.getValue());}}
}
五、HashMap小结
- Map接口的常用实现类:HashMap、Hashtable和Properties
- HashMap是Map接口使用频率最高的实现类
- HashMap以key-value对的方式来存储数据[案例 Entry]
- key不能重复,但是值可以重复,允许使用null键和null值
- 如果添加相同的key,则会覆盖原来的key-val,等同于修改(key不会替换,val会替换)
- 与HashSet一样,不保证映射的顺序,因为底层是以hash表的方式来存储的
- HashMap没有实现同步,因此是线程不安全的
- 不同的key计算出的hash值可能是同一个,也会放在同一个哈希桶里
六、HashMap底层机制
示意图:
1、扩容机制 [和HashSet相同]
HashMap底层维护了内部类Node的数组table,默认为null
当创建对象时,将加载因子(loadfactor)初始化为0.75
当添加key-val时,通过key的哈希值得到在table的索引。然后判断该索引处是否有元素,如果没有元素直接添加。如果该索引处有元素,继续判断该元素的key和准备加入的key相是否等,如果相等,则直接替换val;如果不相等需要判断是树结构还是链表结构,做出相应处理。如果添加时发现容量不够,则需要扩容。
第1次添加,则需要扩容table容量为16,临界值(threshold)为12(16 * 加载因子0.75)
以后再扩容,则需要扩容table容量为原来的2倍(32),临界值为原来的2倍,即24,依次类推
在Java8中,如果一条链表的元素个数超过TREEIFYTHRESHOLD(默认是8),并且table的大小>=MIN_TREEIFY_CAPACITY(默认64),(哈希桶 ≥ 64,单条链表的长度 > 8)就会进行树化(红黑树),树化解决的是桶索引冲突
这里要涉及到一个知识点:哈希冲突
哈希冲突在 HashMap
中有两层含义:
- 第一层冲突(哈希值冲突)
- 不同
key
的原始hashCode()
值相同
- 不同
- 第二层冲突(桶索引冲突)
- 不同哈希值(无论是否相同)通过
hash & (table.length - 1)
计算后,落到同一个桶索引。 - 代码验证:
HashMap<String, Integer> map = new HashMap<>(16); // table.length = 16 String key1 = "KeyA"; // 假设 hashCode() = 100 String key2 = "KeyB"; // 假设 hashCode() = 116// 计算桶索引: int index1 = 100 & (16 - 1); // 100 & 15 = 4 int index2 = 116 & (16 - 1); // 116 & 15 = 4 (不同哈希值,相同桶索引!)map.put(key1, 1); // 存入桶4 map.put(key2, 2); // 也存入桶4 → 哈希冲突!
虽然
key1
和key2
的哈希值不同(100 ≠ 116),但经过位运算后落到同一个桶(索引4)
- 不同哈希值(无论是否相同)通过