当前位置: 首页 > news >正文

Java优化:双重for循环

在工作中,经常性的会出现在两张表中查找相同ID的数据,许多开发者会使用两层for循环嵌套,虽然实现功能没有问题,但是效率极低,一下是一个简单的优化过程,代码耗时凑从26856ms优化到了748ms。

功能场景


有两份List类型的数据,分别是UestList(用户表)和AccountList(账户表),要根据用户的id从AccountList表中查找对应的账户信息,并进行后续的处理,示例如下:

存数据(伪代码):5w条user数据,3w条Account数据 

 @Dataclass User{private Long userId;private String name;}@Dataclass Account{private Long userId;private String content;}public class NestedLoopOptimization{public static List<User> getUserList(){List<User> users =new ArrayList<>();for(inti =1; i <=50000; i++) {User user =newUser();user.setName(UUID.randomUUID().toString());user.setUserId((long) i);users.add(user);}return users;}public static List<UserMemo> getAccountTestList(){List<Account> accountList =newArrayList<>();for(inti =30000; i >=1; i--) {Account account =new Account();account.setContent(UUID.randomUUID().toString());account.setUserId((long) i);accountList.add(account);}return accountList;}// ... 后续代码
最直接的实现方式(未优化的代码):
public static void nestedLoop(List<User> usersList, List<UserMemo> accountList) {for (User user : usersList) {Long userId = user.getUserId();for (Account account : accountList) {if (userId.equals(account.getUserId())) {String content = account.getContent();// System.out.println("模拟数据content 业务处理......" + content); // 避免打印影响测试结果}}}
}

 耗时:约数万毫秒,效率很低,数据量小的话无关紧要,如果随着系统的迭代数据量骤增的时候,就会极其耗时。

第一步优化:添加break 

每个userId在AccountList中只有一条对应的数据,所以找到匹配项之后就可以跳出内循环:

public static void nestedLoop(List<User> usersList, List<UserMemo> accountList) {for (User user : usersList) {Long userId = user.getUserId();for (Account account : accountList) {if (userId.equals(account.getUserId())) {String content = account.getContent();// System.out.println("模拟数据content 业务处理......" + content); // 避免打印影响测试结果break;}}}
}

第一步优化结束之后任需要很多耗时,但是比起嵌套循环好很多。

第二步优化:使用Map优化 

public static void mapOptimizedLoop(List<User> userTestList, List<UserMemo> accountList) {Map<Long, String> contentMap = accountList.stream().collect(Collectors.toMap(UserMemo::getUserId, UserMemo::getContent));for (User user : userTestList) {Long userId = user.getUserId();String content = contentMap.get(userId);if (StringUtils.hasLength(content)) {// System.out.println("模拟数据content 业务处理......" + content); // 避免打印影响测试结果}}}

做以上优化之后,耗时显著减少,通常在数百毫秒级别。

原理:

        两层 for 循环嵌套的时间复杂度为 O(n*m),其中 n 和 m 分别为两个列表的长度。使用 Map 后,get 操作的时间复杂度接近 O(1),整体时间复杂度降为 O(n+m),避免了内循环的重复遍历。HashMap 的 get 方法内部使用了 getNode 方法来查找键值对。getNode 方法利用哈希表结构,快速定位到目标键值对。虽然在极端情况下(所有键的哈希值都相同),getNode 的时间复杂度会退化为 O(n),但在实际应用中,哈希冲突的概率很低,HashMap 的 get 操作效率通常很高。因此无需过于担心 O(n) 的最坏情况。 

        通过以上优化之后,可以显著的提高代码的执行效率,已经其健壮性,尤其是在处理大数据量的时候,使用Map优化,可以带来巨大的性能提升,避免了不必要的计算,从而实现了代码的性能。

相关文章:

  • 2023年ASOC SCI2区TOP,随机跟随蚁群优化算法RFACO,深度解析+性能实测
  • B站Miachael_ee——蓝牙教程笔记
  • 又是一年高考季
  • Redis 与 MySQL 数据一致性保障方案
  • 微服务架构实战:Nacos 单机版的安装与启动流程
  • 2.4 vcpkg 使用
  • Linux 文件系统与 I/O 编程核心原理及实践笔记
  • 关于队列的使用
  • 6.7本日总结
  • python打卡day47
  • 第1讲、包管理和环境管理工具Conda 全面介绍
  • 理想汽车5月交付40856辆,同比增长16.7%
  • 《开篇:课程目录》
  • 33、原子操作
  • Vue中渲染函数的使用
  • Java编程中常见的条件链与继承陷阱
  • 华为云Flexus+DeepSeek征文|华为云一键部署知识库搜索增强版Dify平台,构建智能聊天助手实战指南
  • 【PhysUnits】15.17 比例因子模块 (ratio.rs)
  • 【在线五子棋对战】二、websocket 服务器搭建
  • 僵尸进程是什么?怎么回收?孤儿进程?
  • 寻找郑州网站建设公司/今天全国疫情最新消息
  • 太原住房和城乡建设部网站/郑州网站seo优化公司
  • 怎样做diy家具网站/百度分析
  • design中国官网/自动seo系统
  • 政府部门网站建设简讯/seo渠道是什么意思
  • 大连网站专业制作/真正免费的网站建站平台推荐