当前位置: 首页 > news >正文

EasyExcel动态拆分非固定列Excel表格

使用EasyExcel动态拆分非固定列Excel表格

在Excel数据解析场景中,​动态列结构拆分是典型挑战(如供应链系统中不同品类的属性字段差异较大)。传统基于POJO映射的方案无法应对列数量不固定的场景。本方案采用EasyExcel的动态模型解析和Map数据承载技术,实现按指定列(如"部门")拆分时自动保留原始列结构,支持以下特性:

  • 无需预定义Java实体类
  • 自动继承原始表格所有列头
  • 拆分后文件保留完整数据格式

无实体动态读取表格

继承 AnalysisEventListener 创建一个自定义监听器,用于处理 Excel 文件的解析和数据拆分。在监听器中,可以重写 invokeHeadMap 方法来获取表头信息,重写 invoke 方法来处理每一行数据。

@Data
public class CustomExcelListener extends AnalysisEventListener<Map<Integer, String>> {
    private Map<Integer, String> headerMap; // 表头信息
    private final Map<String, List<Map<String, String>>> dataMap = new LinkedHashMap<>(); // 拆分后的数据,此处使用LinkedHashMap保持插入顺序
    private int specifiedColumnIndex = 0;指定某一列拆分表格,可使用列索引/列名

    @Override
    public void invokeHeadMap(Map<Integer, String> headMap, AnalysisContext context) {
        this.headerMap = headMap;
        // 根据表头初始化 dataMap
        for (Map.Entry<Integer, String> entry : headMap.entrySet()) {
            dataMap.put(entry, new ArrayList<>());
        }
    }

    @Override
    public void invoke(Map<Integer, String> data, AnalysisContext context) {
        // 获取指定列的值
    	String specifiedColumnValue = data.get(specifiedColumnIndex);
    	// 如果指定列的值为空,设置一个默认值
    	if (specifiedColumnValue == null) {
        	specifiedColumnValue = "默认分类";
    	}
    	// 将整行数据存储到对应的分类中
    	dataMap.computeIfAbsent(specifiedColumnValue, k -> new ArrayList<>()).add(new HashMap<>(data));
   	}

    @Override
    public void doAfterAllAnalysed(AnalysisContext context) {
        // 可进行数据校验或数据处理
        // 对于拆分后的数据处理可以在doAfterAllAnalysed()中,也可以通过listener.getDataMap()获取数据后自行处理。
    }
}

解析 Excel 文件

在解析 Excel 文件时,使用 EasyExcel 的 read 方法,并将自定义的监听器传递进去。

File targetFile = new File("/yourFile/file.xls"); // 读取的文件
int specifiedColumnIndex = 0:// 可传入指定列索引,用以拆分excel表格
CustomExcelListener listener = new CustomExcelListener("可传入指定列索引,用以拆分excel表格");
ExcelReader excelReader = EasyExcel.read(targetFile)
            .sheet(0)
            .registerReadListener(listener )
            .doRead();
listener.getDataMap();// 可获取拆分后的表数据

通过 specifiedColumnIndex 变量来指定用于拆分表格的列索引。在实际应用中,这个索引值可能需要根据具体情况动态确定。

总结

通过上述方案,可高效应对供应链、电商等场景中非固定列结构的Excel拆分需求,具体性能优化需自行添加。实际应用中建议结合具体业务场景选择拆分策略(如按时间/地区等多列组合拆分)。

相关文章:

  • 从LLM出发:由浅入深探索AI开发的全流程与简单实践(全文3w字)
  • 【动手学深度学习】#2线性神经网络
  • 重返OI:1999
  • 【双指针】移动零
  • docker部署DVWA-暴力破解-难度从low到impossible
  • AI第一天 自我理解笔记--超参数
  • KMP算法
  • 特殊的数字排序
  • 【Agent】OpenManus-Agent-BaseAgent详细分析
  • PythonWeb开发框架—Flask-APScheduler超详细使用讲解
  • 软件架构设计习题及复习
  • HTML5 drag API实现列表拖拽排序
  • Solana
  • 新手村:混淆矩阵
  • 需求分析、定义、验证、变更、跟踪(高软47)
  • TypeScript
  • 【环境配置】windows下vscode下无法激活conda环境、创建虚拟环境报错
  • RAG的工作原理以及案例列举
  • 牛客周赛85 题解 Java ABCDEFG
  • 2025.3.10--2025.3.16学习周报
  • 锦江酒店:第一季度营业收入约29.42亿元,境内酒店出租率同比增长
  • 阿迪达斯一季度营收增近13%,称美国加征关税对业绩带来不确定性
  • 向总书记汇报具身智能发展的“稚辉君”:从期待到兴奋再到备受鼓舞
  • 北大深圳研究生院成立科学智能学院:培养交叉复合型人才
  • 众信旅游:去年盈利1.06亿元,同比增长228.18%
  • 日本大米价格连续16周上涨,再创最高纪录