HashMap的长度为什么要是2的n次幂以及HashMap的继承关系(元码解析)
我们通过HashMap可以得知
Cloneable 空接口,表示可以克隆。创建并返回HashMap对象的一个副本。
Serializable 序列化接口。属于标记性接口。HashMap对象可以被序列化和反序列化
Abstract Map 父类提供了Map实现接口。以最大限度地减少实现此接口所需的工作。
我们实际上可以发现一个问题也就是HashMap本事就有实现一个Map接口,但是继承的父类里面还是实现着一个Map接口,为什么要这样?
实际上这是一个官方的小错误JAVA集合框架的创始人Josh Bloch描述这样的写法是一个失误,在java集合框架中,类似的写法也有很多,在设计之初,他认为这样写在某些地方可能是有价值的,知道他意识到并没有,显然JDK的维护者, Oracle 公司后来认为这样小小的错误不值得去修改,所以就这样保存了下来。
HashMap集合类的成员
1.序列化版本号,HashMap实现这个接口的时候自带的一个默认版本号。
private static final long serialVersionUID = 362498820763181265L;
2.为什么数组的长度(2^N)
默认的初始化容量是16。
数组长度设计为2的n次幂的主要原因是什么?
HashMap(int initialcapacity)构造一个带指定初始容量和默认加载因子(0.75)的空 Hashap。
我们通过底层可以得知,在向HashMap进行添加元素的时候,根绝key的hash值去确定在数组中的具体位置,HashMap为了存取的高效,要尽量避免减少哈希碰撞,每个链表的长度大致相同,为了实现这一功能,算法采用了取模hash%length,但是计算机中直接求余效率不如进行位移运算,所以源码中使用了hash&(length-1),而hash%length=hash&(length-1)的前提就是length是2的n幂。
我们来进行验证,我们取哈希值为2和3进行运算,下面是我们通过length为2的n次幂来计算没有出现哈希碰撞。
hash=3 & (8-1)
步骤1: 转换为二进制
hash = 3 → 0000 0011
length-1 =7 → 0000 0111
步骤2: 按位与运算0000 0011 (3)
& 0000 0111 (7)
-----------0000 0011 (3) → 最终索引为3hash=2 & (8-1)
步骤1: 转换为二进制
hash = 2 → 0000 0010
length-1 =7 → 0000 0111
步骤2: 按位与运算0000 0010 (2)
& 0000 0111 (7)
-----------0000 0010 (2) → 最终索引为2
当我们不按照这样来进行运算,我们将length变成9
hash=3 & (9-1)
步骤 1: 转换为二进制
hash = 3 → 0000 0011
length-1 =8 → 0000 1000
步骤 2: 按位与运算0000 0011 (3)
& 0000 1000 (8)
-------------------0000 0000 (0) → 最终索引为 0
hash=2 & (9-1)
步骤 1: 转换为二进制
hash = 2 → 0000 0010
length-1 =8 → 0000 1000
步骤 2: 按位与运算0000 0010 (2)
& 0000 1000 (8)
----------------0000 0000 (0) → 最终索引为 0
上面两个例子我们可以看的出来如果数组的长度不是2的n次幂,那么就容易出现哈希碰撞。本质是:当数组长度为 2 的幂时,hash & (length - 1)
能让哈希值低位充分参与运算,索引分布更均匀,减少冲突;若长度非 2 的幂,length - 1
二进制含无效高位 0,会压缩索引范围,增大冲突概率,这也是哈希表(如 HashMap )设计中优先选 2 的幂为数组长度的核心原因 。
注意:如果不考虑效率的话,那么长度就可以随便设置了。