当前位置: 首页 > news >正文

Java中List集合对象去重及按属性去重

请直接移步原文Java中List集合对象去重及按属性去重的8种方法

只记录自己喜欢的几种方法

  • 对象元素整体去重的2种方法
  • 按照对象属性去重的4种方法

预备数据

public class ListRmDuplicate {private List<String> list;private List<Player> playerList;@BeforeEachpublic void setup() {list = new ArrayList<>();list.add("kobe");list.add("james");list.add("curry");list.add("zimug");list.add("zimug");playerList= new ArrayList<>();playerList.add(new Player("kobe","10000")); //科比万岁playerList.add(new Player("james","32"));playerList.add(new Player("curry","30"));playerList.add(new Player("zimug","27")); // 注意这里名字重复playerList.add(new Player("zimug","18")); //注意这里名字和年龄重复playerList.add(new Player("zimug","18")); //注意这里名字和年龄重复}
}

一、集合元素整体去重

List中的String类型以集合元素对象为单位整体去重。如果你的List放入的是Object对象,需要你去实现对象的equals和hashCode方法,去重的代码实现方法和List去重是一样的

方法一

是大家最容易想到的,先把List数据放入Set,因为Set数据结构本身具有去重的功能,所以再将SET转为List之后就是去重之后的结果。这种方法在去重之后会改变原有的List元素顺序,因为HashSet本身是无序的,而TreeSet排序也不是List种元素的原有顺序

@Test
void testRemove1() {/*Set<String> set = new HashSet<>(list);List<String> newList = new ArrayList<>(set);*///去重并排序的方法(如果是字符串,按字母表排序。如果是对象,按Comparable接口实现排序)//List<String> newList = new ArrayList<>(new TreeSet<>(list));//简写的方法List<String> newList = new ArrayList<>(new HashSet<>(list));System.out.println( "去重后的集合: " + newList);
}
方法二

使用就比较简单,先用stream方法将集合转换成流,然后distinct去重,最后在将Stream流collect收集为List。

@Test
void testRemove2() {List<String> newList = list.stream().distinct().collect(Collectors.toList());System.out.println( "去重后的集合: " + newList);
}

二、按照集合元素对象属性去重

其实在实际的工作中,按照集合元素对象整体去重的应用的还比较少,更多的是要求我们按照元素对象的某些属性进行去重。
看到这里请大家回头去看一下上文中,构造的初始化数据playerList,特别注意其中的一些重复元素,以及成员变量重复。

方法一

为TreeSet实现Comparator接口,如果我们希望按照Player的name属性进行排序,就去在Comparator接口中比较name。下文中写了两种实现Comparator接口方法:

  • lambda表达式:(o1, o2) -> o1.getName().compareTo(o2.getName())
  • 方法引用:Comparator.comparing(Player::getName)
@Test
void testRemove5() {//Set<Player> playerSet = new TreeSet<>((o1, o2) -> o1.getName().compareTo(o2.getName()));Set<Player> playerSet = new TreeSet<>(Comparator.comparing(Player::getName));playerSet.addAll(playerList);/*new ArrayList<>(playerSet).forEach(player->{System.out.println(player.toString());});*///将去重之后的结果打印出来new ArrayList<>(playerSet).forEach(System.out::println);
}

输出结果如下:三个zimug因为name重复,另外两个被去重。但是因为使用到了TreeSet,list中元素被重新排序。

Player{name=‘curry’, age=‘30’}
Player{name=‘james’, age=‘32’}
Player{name=‘kobe’, age=‘10000’}
Player{name=‘zimug’, age=‘27’}

方法二(stream)
  • 首先用stream()把list集合转换成流
  • 然后用collect及toCollection把流转换成集合
  • 然后剩下的就和方法一相同了
@Test
void testRemove6() {List<Player> newList = playerList.stream().collect(Collectors.collectingAndThen(Collectors.toCollection(() -> new TreeSet<>(Comparator.comparing(Player::getName))),ArrayList::new));newList.forEach(System.out::println);
}
方法三(不会打乱顺序)

这种方法也是笔者建议大家使用的一种方法,咋一看好像代码量更大了,但实际上这种方法是应用比较简单的方法。

Predicate(有人管这个叫断言,从英文的角度作为名词可以翻译为谓词,作为动词可以翻译为断言)。谓词就是用来修饰主语的,比如:喜欢唱歌的小鸟,喜欢唱歌就是谓词,用来限定主语的范围。所以我们这里是用来filter过滤的,也是用来限制主语范围的,所以我认为翻译为谓词更合适。随便吧,看你怎么觉得怎么理解合理、好记,你就怎么来。

  • 首先我们定义一个谓词Predicate用来过滤,过滤的条件是distinctByKey。谓词返回ture元素保留,返回false元素被过滤掉。
  • 当然我们的需求是过滤掉重复元素。我们去重逻辑是通过map的putIfAbsent实现的。putIfAbsent方法添加键值对,如果map集合中没有该key对应的值,则直接添加,并返回null,如果已经存在对应的值,则依旧为原来的值。
  • 如果putIfAbsent返回null表示添加数据成功(不重复),如果putIfAbsent返回value(value==null :false),则满足了distinctByKey谓词的条件元素被过滤掉。

这种方法虽然看上去代码量增大了,但是distinctByKey谓词方法只需要被定义一次,就可以无限复用。

@Test
void testRemove7() {List<Player> newList = new ArrayList<>();playerList.stream().filter(distinctByKey(p -> p.getName())) //filter保留true的值.forEach(newList::add);newList.forEach(System.out::println);
}static <T> Predicate<T> distinctByKey(Function<? super T, ?> keyExtractor) {Map<Object,Boolean> seen = new ConcurrentHashMap<>();//putIfAbsent方法添加键值对,如果map集合中没有该key对应的值,则直接添加,并返回null,如果已经存在对应的值,则依旧为原来的值。//如果返回null表示添加数据成功(不重复),不重复(null==null :TRUE)return t -> seen.putIfAbsent(keyExtractor.apply(t), Boolean.TRUE) == null;
}

输出结果如下:三个zimug因为name重复,另外两个被去重。并且没有打乱List的原始顺序

Player{name=‘kobe’, age=‘10000’}
Player{name=‘james’, age=‘32’}
Player{name=‘curry’, age=‘30’}
Player{name=‘zimug’, age=‘27’}

方法四

第四种方法实际上不是新方法,上面的例子都是按某一个对象属性进行去重,如果我们想按照某几个元素进行去重,就需要对上面的三种方法进行改造。
我只改造其中一个,另外几个改造的原理是一样的,就是把多个比较属性加起来,作为一个String属性进行比较。

@Test
void testRemove8() {Set<Player> playerSet = new TreeSet<>(Comparator.comparing(o -> (o.getName() + "" + o.getAge())));playerSet.addAll(playerList);new ArrayList<>(playerSet).forEach(System.out::println);
}
http://www.dtcms.com/a/299080.html

相关文章:

  • 【Linux系统】理解硬件 | 引入文件系统
  • MySQL数据库本地迁移到云端完整教程
  • 部署上线你的项目
  • 【Git】实用Git操作指南:从入门到高效协作
  • 小米携手云轴科技ZStack获信通院可信云用户典型实践奖
  • 大语言模型 LLM 通过 Excel 知识库 增强日志分析,根因分析能力的技术方案(2):LangChain + LlamaIndex 实现
  • Nanopct6SDK问题汇总与解决方案
  • 【架构】Docker简单认知构建
  • 【工程化】浅谈前端构建工具
  • Python爬虫实战:研究purl库相关技术
  • Mistral AI开源 Magistral-Small-2507
  • 密码学系列 - 密钥派生
  • 界面规范3-列表下
  • “给予” 超越 “莲花”,支持图片在线编辑
  • AI是否会终结IT职业?深度剖析IT行业的“涌现”与重构
  • 【GaussDB】构建一个GaussDB的Docker镜像
  • 【GaussDB】如何从GaussDB发布包中提取出内核二进制文件
  • window下MySQL安装(二)疑难解答
  • Apache Doris Data Agent 解决方案:开启智能运维与数据治理新纪元
  • excel删除重复项场景
  • Java面试题及详细答案120道之(021-040)
  • 字节跳动扣子 Coze 宣布开源:采用 Apache 2.0 许可证,支持商用
  • Qt 远程过程调用(RPC)实现方案
  • 网络基础19--OSPF路由业务多区域
  • 【Android】相对布局应用-登录界面
  • Java 中 System 类零度解析
  • 4N90-ASEMI电机控制专用4N90
  • 【数据结构】树的概念
  • 统计与大数据分析与数学金融课程解析
  • Avantage6.6下载与安装教程