当前位置: 首页 > news >正文

实战排查:Java 解析 Excel 大型 导致内存溢出问题的完整解决过程

问题现象

系统上线运行一段时间后,出现无响应并最终挂掉的情况。查看应用日志,发现明确的内存溢出错误信息:java.lang.OutOfMemoryError: Java heap space

排查过程

步骤一:配置 JVM 参数,捕获内存快照

为了能够复现并分析问题,首先需要配置合适的 JVM 参数,以便在发生内存溢出时自动生成内存快照文件(hprof):

# 调小堆内存以便更快复现问题(根据实际情况调整)
-Xms512m -Xmx1024m
# 当发生内存溢出时自动生成堆快照
-XX:+HeapDumpOnOutOfMemoryError
# 指定堆快照文件保存路径
-XX:HeapDumpPath=./heapdump.hprof
# 打印 GC 日志,辅助分析
-XX:+PrintGCDetails -XX:+PrintGCDateStamps -Xloggc:./gc.log

步骤二:使用 MAT 工具分析内存快照

  1. 启动 MAT 工具,打开生成的 heapdump.hprof 文件
  2. 查看内存占用饼图,直观了解内存分配情况
  3. 查看堆栈跟踪,定位到具体代码位置
    通过上述分析,发现内存主要被 Apache POI 相关的对象占用,进一步跟踪堆栈信息,最终定位到项目中的 ExcelUtils 工具类,确定是 Excel 解析过程导致的内存溢出
    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述

直接原因

项目中使用了 Apache POI 的 XSSFWorkbook 类解析 Excel 文件,XSSFWorkbook 采用的是非流式解析模式,会将整个 Excel 文件(包括所有工作表、单元格、公式、样式等)全部加载到内存中,生成完整的对象树。
当处理大型 XLSX 文件(尤其是包含数万行数据或复杂公式的文件)时,这种解析方式会占用大量内存,最终超出 JVM 堆内存限制,触发 OutOfMemoryError: Java heap space。

深层原因:POI 资源未释放导致的引用泄漏

Apache POI 的 XSSFWorkbook/SXSSFWorkbook 对象不仅占用内存,还会持有 InputStream、临时文件句柄等资源,如果未正确释放,会导致严重的内存泄漏:

POI 的 Workbook 实现类通过 finalize() 方法实现资源延迟释放,当 Workbook 对象失去用户引用后,会被加入 Finalizer 队列:
· Finalizer 线程会异步调用 finalize() 方法释放资源
· 这个过程不可控且可能延迟很久,甚至在 OOM 前都未执行
· 在 finalize() 执行前,Workbook 对象会被 Finalizer 队列的引用持有,GC 无法回收

解决方式

1. 使用流式API处理大型Excel
// 正确示例:使用SXSSFWorkbook流式处理
public List<Data> parseExcel(MultipartFile file) {try (InputStream is = file.getInputStream();// 使用SXSSFWorkbook,限制内存中保留的行数Workbook workbook = new SXSSFWorkbook(WorkbookFactory.create(is), 100)) {Sheet sheet = workbook.getSheetAt(0);List<Data> dataList = new ArrayList<>();// 流式处理行数据for (Row row : sheet) {// 解析逻辑...}// SXSSFWorkbook会自动清理临时文件return dataList;} catch (Exception e) {throw new RuntimeException("Excel解析失败", e);}
}
2.确保资源正确释放
// 确保资源释放的正确模式
public List<Data> parseExcelSafely(MultipartFile file) {Workbook workbook = null;try {workbook = WorkbookFactory.create(file.getInputStream());// 处理逻辑...return processWorkbook(workbook);} catch (Exception e) {throw new RuntimeException("Excel解析失败", e);} finally {if (workbook != null) {try {workbook.close(); // 关闭Workbook} catch (IOException e) {// 记录关闭异常log.error("关闭Workbook失败", e);}}}
}

3.EasyExcel

大幅降低了内存溢出风险:其流式解析机制从根本上解决了 POI 全量加载导致的内存问题

http://www.dtcms.com/a/409827.html

相关文章:

  • 【实录】使用 Verdaccio 从零搭建私有 npm 仓库(含完整步骤及避坑指南)
  • 物联网人体红外检测系统详解
  • 关于Unix Domain Socket的使用入门
  • 机器视觉系统中工业相机的常见类型及其特点、应用
  • RTT操作系统(4)
  • 基于卷积神经网络的 CIFAR-10 图像分类实验报告
  • 微服务项目->在线oj系统(Java-Spring)----[前端]
  • 做网站撘框架小米手机如何做游戏视频网站
  • 如何建自己网站做淘宝客黄骅港吧
  • 交叉口内CAV调度:轨迹优化与目标速度规划,助力智能交通无缝运行!
  • Navicat 技术指引 | KingbaseES 专用 AI 助手
  • 如何优化Android app耗电量
  • 面试复习题---Flutter 资深专家
  • 在 C# 中将邮件转换为 PDF | MSG 转 PDF | EML 转 PDF
  • 【LangChain4j+Redis】会话记忆功能实现
  • Android Handler的runWithScissors方法
  • 180课时吃透Go语言游戏后端开发3:Go语言中其他常用的数据类型
  • 在 Android 11 上实现 WiFi 热点并发支持(同时开启 STA + AP 模式)
  • 济南高新区网站建设wordpress举报插件
  • html 占位符
  • GPT-5 Codex正式上线 Azure AI Foundry(国际版)
  • C++设计模式之结构型模式:享元模式(Flyweight)
  • STM32 智能垃圾桶项目笔记(一):超声波模块(HC-SR04)原理与驱动实现
  • 全文 -- Vortex: Extending the RISC-V ISA for GPGPU and 3D-Graphics Research
  • 设计网站推荐理由公司网站备案电话
  • 事件驱动与CDS:基于FHIR R5 Subscriptions与Bulk Data的再考察(下)
  • Tigshop开源商城系统 Java v5.2.2 / PHP v5.1.6版本正式发布(ES搜索上新)
  • 仙游县住房和城乡建设局网站1元涨1000粉丝网站
  • 【Linux】进程概念(六):进程地址空间深度解析:虚拟地址与内存管理的奥秘
  • 网站怎么做微信登录界面wordpress restful