当前位置: 首页 > news >正文

深入解析HashMap的存储机制:扰动函数、哈希计算与索引定位

今天复习了一下HashMap的部分,写一篇博客记录一下今天学习内容

虽然之前学习过,但由于后来没怎么使用过而且也没复习基本忘得差不多了

在Java的HashMap中,高效存储键值对的核心在于哈希算法和索引定位。本文将结合源码逐步拆解存储流程,并给出代码示例。

 核心流程概述
  1. 扰动函数处理Key 通过扰动函数优化Key的哈希值,减少碰撞
  2. 存储哈希值 计算后的哈希值存入Node对象的hash字段
  3. 计算桶下标 用(n-1) & hash定位数组索引(n为数组长度)
  4. 存入数据结构 根据下标存入数组(或链表/红黑树)
 源码级分步解析(基于JDK 17)
① 扰动函数与哈希计算
static final int hash(Object key) {int h;return (key == null) ? 0 : (h = key.hashCode()) ^ (h >>> 16);
}

  • 作用:将原始哈希码的高16位与低16位异或
  • 目的:让高位参与运算,解决低位相同导致的哈希碰撞
  • 结果:扰动后的哈希值存储在Node的hash字段
② Node对象结构
static class Node<K,V> implements Map.Entry<K,V> {final int hash; // 存储扰动计算后的哈希值final K key;V value;Node<K,V> next; // 链表结构指针
}

③ 索引定位公式
// 在putVal方法中:
int index = (n - 1) & hash;
  • n-1:当前数组长度减1(如长度16→15,二进制0...01111
  • 位与运算:高效实现取模运算,hash % n等价于(n-1) & hash
    ④ 完整put流程伪代码
    final V putVal(int hash, K key, V value) {Node<K,V>[] tab; Node<K,V> p; int n, i;// 1. 首次使用触发初始化if ((tab = table) == null || (n = tab.length) == 0)n = (tab = resize()).length;// 2. 计算桶下标 (核心公式)i = (n - 1) & hash;// 3. 处理碰撞情况if ((p = tab[i]) == null) tab[i] = newNode(hash, key, value); // 无碰撞直接存else {// 碰撞后遍历链表/红黑树if (p.hash == hash && ...)// 更新已存在key的值else {// 链表新增节点if (binCount >= TREEIFY_THRESHOLD - 1)treeifyBin(tab, hash); // 链表转红黑树}}
    }

    举个🌰 实战示例与验证
    import java.util.*;public class HashMapDemo {public static void main(String[] args) {HashMap<String, Integer> map = new HashMap<>(16); // 初始容量16// 存储键值对 "A":1map.put("A", 1);// 手动验证存储过程String key = "A";// 1. 原始哈希码int hashCode = key.hashCode(); System.out.println("原始哈希码: 0x" + Integer.toHexString(hashCode));// 2. 扰动计算int perturbedHash = hash(key);System.out.println("扰动哈希值: 0x" + Integer.toHexString(perturbedHash));// 3. 计算桶下标 (n=16)int n = 16;int index = (n - 1) & perturbedHash;System.out.println("数组下标: " + index);}// JDK扰动函数实现static int hash(Object key) {int h;return (key == null) ? 0 : (h = key.hashCode()) ^ (h >>> 16);}
    }

    输出结果

    原始哈希码: 0x41
    扰动哈希值: 0x41  // 小值无高位变化
    数组下标: 1       // (16-1)=15: 0b1111 & 0x41=65 → 1
     设计原理深度剖析
    1. 为什么用位与代替取模?

      • 位运算(n-1) & hash%效率高10倍以上(实测)
      • 前提:数组长度必须是2的幂(保证n-1的二进制全为1)
    2. 扰动函数的必要性

       原始哈希: 0x1234abcd 和 0x5678abcdn=16时:未扰动 → 两值低位相同 → 碰撞扰动后 → 高位参与运算 → 低位不同 → 避免碰撞

         3.哈希碰撞策略

    最佳实践建议
    1. 避免自定义Key哈希碰撞
       // 错误实现:所有对象返回相同哈希码@Overridepublic int hashCode() { return 1; } // 导致HashMap退化为链表// 正确实现:组合关键字段哈希@Overridepublic int hashCode() {return Objects.hash(field1, field2);}

    1. 初始化容量优化
       // 预期存储1000个元素时new HashMap<>(2048); // 避免扩容 (1000/0.75≈1333 → 取2的幂2048)

    至此,本章的内容结束,后续我会补充一下在高并发情况下HashMap会出现的一些问题    

        http://www.dtcms.com/a/342053.html

        相关文章:

      1. Halcon那些事:Halcon非常核心的1个概念reduce_domain算子的理解和1个详细的使用示例
      2. Nginx缓存配置指南:使用proxy_cache为动态网站提速10倍
      3. WPF中UI线程频繁操作造成卡顿的处理
      4. Ingress控制器深度解析:Nginx与Traefik实战指南
      5. 【DICOM HL7】DICOM hl7协议的哪个字段对应操作者,操作者ID?
      6. C++析构函数
      7. Linux下Docker版本升级保姆攻略
      8. 结合 Flutter 和 Rust 的跨平台开发方案
      9. 微软Auzre云的技术支持运营模式是什么
      10. Flutter - UI布局
      11. Android APP防止应用被动态调试
      12. 大数据毕业设计选题推荐-基于大数据的北京气象站数据可视化分析系统-Hadoop-Spark-数据可视化-BigData
      13. 浏览器【详解】页面加载过程(含页面加载时序图,页面加载性能优化方案)
      14. 搭建我的世界mc服务器全流程——阿里云游戏攻略
      15. 09_测试与性能优化
      16. 新型犯罪浪潮下的法律迷局:网络、AI与跨境犯罪解析
      17. 惯性导航中的IMU传感器是什么?
      18. 第5.2节:awk变量的使用
      19. 适配器模式 java demo
      20. 电能质量监测装置 分布式光伏安全并网“准入证”
      21. AI工作负载“加速跑”,高性能网络如何“护航”?
      22. EfficientVMamba代码略讲
      23. 档案宝系统功能:权限分级,保障档案安全
      24. KingbaseES数据库增删改查操作分享
      25. 项目集成 Chrono 时间轴
      26. Pytest 插件怎么写:从0开发一个你自己的插件
      27. SamOutVXP: 轻量级高效语言模型
      28. 用nohup setsid绕过超时断连,稳定反弹Shell
      29. Spring 循环依赖:从 “死锁” 到 “破局” 的完整解析
      30. 在.NET 8 中使用中介模式优雅处理多版本 API 请求