当前位置: 首页 > news >正文

Java基础系列-ArrayList源码解析

文章目录

  • **核心数据结构**
  • **动态扩容机制**
  • **添加元素流程**
    • 整体流程(以 add(E e) 为例)
    • **场景1:第一次添加元素(空数组扩容)**
    • **场景2:末尾插入且容量充足**
    • **场景3:触发扩容(容量不足)**
      • **扩容核心方法 `grow()`**
      • **安全检查方法 `hugeCapacity(minCapacity)`**
        • 拓展1:`MAX_ARRAY_SIZE` **的存在意义**
        • **拓展2:**`hugeCapacity` **处理溢出**
        • **拓展3:为什么允许返回** `Integer.MAX_VALUE`
    • **场景4:中间插入(需移动元素)- `add(int index, E e)`**
      • **核心方法 `add(int index, E e)`**
  • **删除元素流程(以 remove(int index) 为例)**
  • **ModCount 作用**
  • **线程安全性**
  • **性能优化技巧**
  • **与 LinkedList 的对比**

Java 的 ArrayList 是集合框架中最核心的动态数组实现,也是高频使用的容器之一。

核心数据结构

基于数组实现,维护 elementData 数组存储元素:

// JDK 1.8
transient Object[] elementData; // 实际存储元素的数组
private int size;               // 当前元素数量
  • transient 修饰的 elementData 不会被默认序列化(通过自定义序列化逻辑优化存储)

动态扩容机制

当添加元素时发现容量不足,触发 grow(int minCapacity) 扩容:

private void grow(int minCapacity) {int oldCapacity = elementData.length;int newCapacity = oldCapacity + (oldCapacity >> 1); // 扩容为旧容量的1.5倍if (newCapacity - minCapacity < 0)newCapacity = minCapacity; // 最小需要满足 minCapacityelementData = Arrays.copyOf(elementData, newCapacity);
}

核心逻辑

  1. 扩容倍率:新容量 = 旧容量 * 1.5(位运算 oldCapacity >> 1 代替除法优化性能)

  2. 数组拷贝Arrays.copyOf() 底层使用 System.arraycopy(),为本地方法(效率高)


添加元素流程

整体流程(以 add(E e) 为例)

public boolean add(E e) {ensureCapacityInternal(size + 1); // 确保容量足够elementData[size++] = e;          // 尾部插入元素return true;
}
  • 容量检查:若当前数组已满,触发扩容后再插入

  • 尾部插入:时间复杂度 O(1)
    在这里插入图片描述

场景1:第一次添加元素(空数组扩容)

  • 触发条件:默认构造的 ArrayList(初始 elementData 为空数组)首次调用 add()

  • 流程

    1. minCapacity = size + 1 = 1

    2. 判断当前容量 elementData.length = 0,需要扩容。

    1. 计算新容量 newCapacity = max(10, 1)newCapacity = 10.

    2. 新数组 elementData = new Object[10],将元素插入首位。

场景2:末尾插入且容量充足

  • 流程

    1. ensureCapacityInternal(size + 1) ➔ 无需扩容。

    2. elementData[size++] = e ➔ 直接插入末尾,无需移动元素,O(1) 时间复杂度

场景3:触发扩容(容量不足)

  • :数组已满(size == elementData.length)时添加新元素。

  • 扩容步骤

    1. oldCapacity = 10.

    2. 计算增长量 oldCapacity >> 1 = 5newCapacity = 15.

    1. Arrays.copyOf(elementData, 15) ➔ 快速本地方法拷贝数组。

    2. 扩容代价:数组拷贝 O(n),需在插入时尽量避免频繁扩容。

扩容核心方法 grow()

private void grow(int minCapacity) {int oldCapacity = elementData.length;int newCapacity = oldCapacity + (oldCapacity >> 1); // 计算1.5倍扩容if (newCapacity - minCapacity < 0) {newCapacity = minCapacity; // 手动调整至至少满足 minCapacity}if (newCapacity - MAX_ARRAY_SIZE > 0) {newCapacity = hugeCapacity(minCapacity); // 安全检查(最大容量限制)}elementData = Arrays.copyOf(elementData, newCapacity);
}

安全检查方法 hugeCapacity(minCapacity)

private static final int MAX_ARRAY_SIZE = Integer.MAX_VALUE - 8;private static int hugeCapacity(int minCapacity) {if (minCapacity < 0) // 溢出判断:如果 minCapacity 已经超过 Integer.MAX_VALUE,会变成负数throw new OutOfMemoryError(); // 比较需求容量和最大数组容量约束(Integer.MAX_VALUE - 8)return (minCapacity > MAX_ARRAY_SIZE) ? Integer.MAX_VALUE : MAX_ARRAY_SIZE;
}

hugeCapacity 的决策逻辑分为:

  • 情况 1minCapacity 正常(非负且 <= MAX_ARRAY_SIZE

    → 返回 MAX_ARRAY_SIZE(即 Integer.MAX_VALUE - 8)。

  • 情况 2minCapacity > MAX_ARRAY_SIZE

    → 直接返回 Integer.MAX_VALUE(允许尝试分配更大的容量,但可能导致 OOM)。

  • 异常处理minCapacity < 0(溢出导致)

    → 抛出 OutOfMemoryError(申请容量已超过 Integer.MAX_VALUE,无法满足)。

拓展1:MAX_ARRAY_SIZE 的存在意义

Java 规范允许 JVM 实现为数组对象分配内存时保留一部分头部信息(如对象头、数组长度等),可能导致某些情况下实际数组最大可用容量小于 Integer.MAX_VALUE。约定 MAX_ARRAY_SIZE = Integer.MAX_VALUE - 8 是为了避免直接分配 Integer.MAX_VALUE 导致内存不足,属于一种保护性设计

拓展2:hugeCapacity 处理溢出

minCapacity 的值因为连续扩容超过 Integer.MAX_VALUE 时,会变成一个负数(整数溢出)。此时 minCapacity < 0 的检查会立即抛出 OutOfMemoryError,避免试图创建非法数组。

拓展3:为什么允许返回 Integer.MAX_VALUE

在 JVM 实现支持的情况下,部分版本的 JVM 可能允许数组实际容量接近 Integer.MAX_VALUEhugeCapacity 在此刻做了一个折中决策

  • 优先尝试返回 Integer.MAX_VALUE(信任 JVM 能处理)。

  • 若 JVM 实际无法分配,则会在 Arrays.copyOf() 阶段抛出 OutOfMemoryError

场景4:中间插入(需移动元素)- add(int index, E e)

list.add(2, "hello"); // 在索引2处插入元素
  • 流程

    1. 检查索引合法性(index >= 0 && index <= size)。

    2. 检查容量 ➔ 不够则扩容。

    1. 计算需要移动的元素数量: numMoved = size - index = 3.

    2. 调用 System.arraycopy(elementData, 2, elementData, 3, numMoved),将原数据从索引2开始的元素后移1位。

    1. elementData[2] = "hello".

    2. 时间复杂度:平均 O(n).

核心方法 add(int index, E e)

public void add(int index, E element) {rangeCheckForAdd(index); // 索引范围检查ensureCapacityInternal(size + 1); // 移动元素:需向后移的元素数量 = size - indexSystem.arraycopy(elementData, index, elementData, index + 1, size - index);elementData[index] = element;size++;
}

删除元素流程(以 remove(int index) 为例)

public E remove(int index) {rangeCheck(index); // 索引越界检查modCount++;         // 结构性修改次数(用于迭代器快速失败)E oldValue = elementData(index); // 保存被删除元素int numMoved = size - index - 1; // 需要移动的元素数量if (numMoved > 0) {// 将 index+1 到末尾的元素向前移动一位System.arraycopy(elementData, index+1, elementData, index, numMoved);}elementData[--size] = null; // 清空原末尾元素,帮助GCreturn oldValue;
}

核心点

  • 移动代价:平均时间复杂度 O(n),末尾删除为 O(1)

  • GC处理:手动赋 null 避免内存泄漏

ModCount 作用

迭代器通过 modCount 追踪结构性修改:

private class Itr implements Iterator<E> {int expectedModCount = modCount; // 记录创建迭代器时的修改次数public E next() {checkForComodification(); // 检查是否发生结构性修改// ... 其他逻辑}final void checkForComodification() {if (modCount != expectedModCount)throw new ConcurrentModificationException();}
}
  • 结构性修改:任何导致 size 变化或元素位置变化的操作(增、删、排序等)

  • 多线程问题:未同步时快速失败机制能检测部分并发问题

线程安全性

  • 非线程安全ArrayList 的设计不保证多线程环境下的安全

  • 替代方案

    • Collections.synchronizedList(new ArrayList<>()) 同步包装类

    • CopyOnWriteArrayList 写时复制容器(适合读多写少场景)

性能优化技巧

  1. 初始化时指定容量:避免频繁扩容

    ArrayList<String> list = new ArrayList<>(1000); // 直接指定初始容量
    
  2. 批量操作优先:避免循环内多次扩容

    list.addAll(Arrays.asList("A", "B", "C")); // 批量添加减少扩容次数
    
  1. 谨慎使用 contains/remove(Object):时间复杂度 O(n),高频操作可改用 HashSet

与 LinkedList 的对比

操作ArrayListLinkedList
随机访问O(1)(通过索引)O(n)(需要遍历链表)
头部插入/删除O(n)(需移动元素)O(1)(只需调整指针)
内存占用紧凑(无需指针)每个元素需额外指针空间
适用场景读多写少、随机访问高频频繁增删、顺序访问

相关文章:

  • 【verilog】Verilog 工程规范编码模板
  • webgl入门实例-07顶点缓冲区基本概念
  • LabVIEW液压系统远程监控与故障诊断
  • 【创新实训个人博客】前端实现
  • 基于Flask的漏洞挖掘知识库系统设计与实现
  • Java语言实现递归调用算法
  • Java课堂6
  • 组合模式实战:用树形结构管理企业组织与文件系统
  • 【PyTorch】PyTorch中的非线性激活函数详解:原理、优缺点与实战指南
  • 自求导实现线性回归与PyTorch张量详解
  • 【第46节】windows程序的其他反调试手段中篇
  • ubuntu 向右拖动窗口后消失了、找不到了
  • 高通手机抓取sniffer log的方法
  • Python网络爬虫设计(二)
  • C++入门基础:命名空间,缺省参数,函数重载,输入输出
  • vue3 Ts axios 封装
  • Vscode 插件开发
  • 03_Americanas精益管理项目_StarRocks
  • 巧用ChatGPT生成适合小白的Python练习题,助力编程入门
  • 具身智能机器人学习路线全解析
  • 2024年全国博物馆接待观众14.9亿人次
  • 菲律宾中期选举结果揭晓,马科斯与杜特尔特家族重回“权力的游戏”
  • 世界数字教育大会发布“数字教育研究全球十大热点”
  • 俄乌谈判开始
  • “家国万里时光故事会” 举行,多家庭共话家风与家国情怀
  • 李强:把做强国内大循环作为推动经济行稳致远的战略之举