当前位置: 首页 > news >正文

论文:Generalized Category Discovery with Clustering Assignment Consistency

论文下载:

https://arxiv.org/pdf/2310.19210

一、基本原理

该方法包括两个阶段:半监督表示学习和社区检测。在半监督表示学习中,使用了监督对比损失来充分地推导标记信息。此外,由于对比学习方法与协同训练假设一致,研究引入了同一样本的弱增强和强增强以提取两种不同的视图。最后,该研究还部署了协同训练框架,以加强两个视图之间特征原型相似性和聚类分配的一致性。在社区检测中,研究利用在半监督表示学习中学习到的特征嵌入来构造主图,然后应用社区检测方法来获得结果。

二、拟解决的关键问题

为了克服使用新类别发现(NCD)、半监督学习k-means的限制,该研究提出了一种用于聚类分配的协同训练一致性策略,以发现未标记数据集中的潜在表示。对于最终的聚类目标,研究利用社区检测技术为未标记的实例分配标签,并根据学习到的表示自动确定聚类类别的最佳数量。

三、相关解决方案

对通用数据集的评估结果如图1所示。该方法在所有通用数据集(特别是在ImageNet100上)上的All和Novel测试中达到了最先进的性能,也与已知的其他方法取得了相当的结果。具体来说,对于所有类,该方法在CIFAR-10、CIFAR-100和ImageNet-100上分别比GCD方法高0.8%、5.5%和7.0%。对于Novel类,它在CIFAR-10上高6.2%,在CIFAR-100上高9.1%,在ImageNet-100上高15.5%。这些实验结果表明,该方法在未标记的数据集上学习到更紧凑的表示。此外,UNO+使用线性分类器,它在已知类上显示出很强的准确性,但在新颖类上导致性能较差。

图1 通用数据集验结果

图2中报告了三个细粒度数据集的结果。该方法在测试的三个数据集的所有类上显示出最佳性能,并且在已知类和新颖类上取得了可比的结果,证明了方法在细粒度类别发现方面的有效性。具体来说,在CUB-200、Stanford-Scars和herbarum19数据集上,方法在所有类别上分别比最先进的方法提高了6.7%、8.6%和0.9%。对于Novel类,方法在Stanford-cars和herbararium19上分别比GCD高3.9%和3.7%。同时,研究发现,由于细粒度数据集之间的低可变性,使得发现新颖类更加困难,因此在结果方面,新颖类的精度通常较低。

图2 三个细粒度数据集实验结果

为了更直观地探索不同方法上的聚类特征,本研究在CIFAR-10上使用T-SNE将DINO、GCD和我们的方法提取的特征进一步可视化。如图所示,与DINO和GCD相比,该方法得到了更清晰的群间边界,也得到了更紧凑的簇。

图3 邻域大小消融实验结果

图4 聚类结果

四、总结

本研究引入了一个聚类分配一致性框架,提出了一种GCD的协同训练策略。此外,还提出了一种社区检测方法来解决GCD中的半监督聚类问题。实验结果表明,该方法在通用和细粒度任务中都达到了最先进的性能。

五、思考

通过研究结果可以看出,该研究提出的一种用于聚类分配的协同训练一致性策略在对通用数据集以及三个细粒度数据集上都取得了较好的结果,也得到了更清晰的簇与簇边界,但是在新颖类的发现上性能较差,可以尝试对该方法进行改进。

http://www.dtcms.com/a/107474.html

相关文章:

  • 获取各类基本因子
  • day21和day22学习Pandas库
  • Ray Flow Insight:让分布式系统调试不再“黑盒“
  • 【模型部署】onnx模型-LOOP 节点实例
  • 2.3.3 使用@Profile注解进行多环境配置
  • 高通将进军英国芯片 IP 业务 Alphawave
  • Qt线程等待条件QWaitCondition
  • 深入理解DRAM刷新机制:异步刷新为何无需扣除刷新时间?
  • 风电行业预测性维护解决方案:给风机装上 “智能医生”,实现故障 “秒级预警”
  • HTMX构建无重载闪烁的交互式页面
  • Vue开发系列——npm镜像问题
  • Frida Hook Native:jobjectArray 参数解析
  • SQL Server 增删改查详解
  • 使用pytesseract和Cookie登录古诗文网~(python爬虫)
  • 从Hugging Face下载Qwen/Qwen2-Audio-7B-Instruct模型到本地运行,使用python实现一个音频转文字的助手
  • 树莓派超全系列教程文档--(21)用户配置
  • 芋道源码——Spring Cloud Bus RocketMQ 入门
  • 《全栈+双客户端Turnkey方案》架构设计图
  • 软件版本号递增应该遵循的规范
  • 分层防御:对称与非对称加密如何守护数字世界
  • 0402-对象和类(访问器 更改器 日期类)
  • 北方算网获邀在中关村论坛发言 解析人工智能+产业落地核心路径
  • 【数据库原理及安全实验】实验一 数据库安装与创建
  • openEuler24.03 LTS下安装HBase集群
  • YOLO学习笔记 | 基于YOLOv5的车辆行人重识别算法研究(附matlab代码)
  • Ubuntu 22.04 安装和运行 EDK2 超详细教程
  • 门控循环单元(GRU)基础学习与实例:电影评论情感分类
  • 微信小程序开发-01.介绍
  • Java 基础-29-final关键字-详解
  • 当网页受到DDOS网络攻击有哪些应对方法?