当前位置: 首页 > news >正文

CVPR 2025 | 华科精测:无需人工标注也能精准识别缺陷类别,AnomalyNCD 实现多类别缺陷自主分类

导读

论文地址:https://arxiv.org/abs/2410.14379

项目地址:https://github.com/HUST-SLOW/AnomalyNCD

华中科技大学慢工团队长期从事高自主化工业质检技术研究及产业化应用工作,2024年提出了国际首个无需训练、无需提示的零样本工业缺陷检测方法MuSc,该技术自提出以来,长期稳居Paper with Code零样本异常检测排行榜国际第一,获得业界的广泛关注。MuSc结合AnomalyNCD,在国际范围内首次实现了“缺陷自主检”、“类别自主分”的高迁移性工业质检新体系。

MuSc论文:https://arxiv.org/abs/2401.16753

MuSc代码:https://github.com/xrli-U/MuSc

点击阅读原文,获取更多咨询

工业质检从检出缺陷到理解缺陷的必经之路 —— 多分类任务的迫切性与挑战

在工业质检领域中,对工业缺陷类别进行识别,即缺陷多类分类,具有广泛的应用,从产品等级划分,到缺陷成因溯源和产线工艺优化,都需要具备识别缺陷类别的能力,多类别缺陷分类正成为产线智能化的核心刚需,新的挑战也随之浮出水面:

  1. 柔性生产已成为业界主流,产线生产的产品变化快,随时会出现新型缺陷,缺陷样本搜集难,人工标注成本高,使用监督式的参数化分类器进行分类,难以适应产线的快速迭代需求。

  2. 从成因来看,工业缺陷具有一定的随机性,因此缺陷类内差异极大,同类缺陷在特征空间中聚合度不足,采用非参数化聚类对缺陷类别进行划分,精度尚无法达到产业应用水平。

破局之道——三大技术革新实现缺陷分类自主化

针对上述业界迫切需求及当前技术瓶颈,华中科技大学慢工团队联合精测电子,创新性的提出了AnomalyNCD,该方法采用自监督训练的方式对缺陷表征和参数化分类器进行学习,摆脱了训练过程对标注样本的依赖,实现了高精度工业缺陷自主类别划分,该方法兼具全监督学习和聚类方法的优势,同时规避了他们面向工业缺陷数据时的局限性,应用潜力巨大。

该方法主要包含三项革新技术:

  1. 主元素二值化(MEBin):给缺陷画重点

  • 创新性的提出了自适应二值化方法,通过动态搜索阈值,提取跨阈值稳定的缺陷主体,解决了当前产业需要人工设定二值化阈值的瓶颈。

  • 效果:能够为每个待测图片都分配一个最优的二值化阈值,相比固定阈值以及传统 Otsu 二值化,同时实现了较低的误检率与漏检率。

表格描述已自动生成

表格描述已自动生成

图片包含日历描述已自动生成

图片包含日历描述已自动生成

  1. 掩膜引导(Mask-Guided)表征学习:让模型看应该看的地方

  • 利用 MEBin 生成的缺陷掩膜,约束Vision Transformer 聚焦真实缺陷区域,并结合伪标签技术,替代人工标注标签完成表征学习。

  • 突破:工业缺陷弱语义、易混淆,模型常因背景干扰难以聚焦,掩膜引导显著提升了缺陷特征的提取能力,实现无人工标注下的细粒度缺陷的表征学习。

图片包含公司名称描述已自动生成

图片包含公司名称描述已自动生成

  1. 区域面积加权合并:从局部判断到全局决策

  • 提出基于缺陷区域面积的加权融合策略:大尺寸的真实缺陷拥有更高决策权重,小尺寸误检区域的影响被大幅削弱。

  • 价值:整合图像中各区域的分类结果,实现区域级与图像级的灵活分类输出。

价值体现——数据说话的工业级鲁棒性

  1. 性能表现惊艳: MVTecAD:F1提升(10.8%),NMI提升(8.8%),ARI提升(9.5%) MTD:F1提升(12.8%),NMI提升(5.7%),ARI提升(10.8%)

    表格描述已自动生成

  2. 灵活集成: 可以与任意异常检测方法进行无缝结合使用,结合PatchCore、MuSc、CPR等主流异常检测模型的结果都十分优异。

关注下方《AI前沿速递》🚀🚀🚀
各种重磅干货,第一时间送达
码字不易,欢迎大家点赞评论收藏

http://www.dtcms.com/a/304084.html

相关文章:

  • 实用PDF演示解决方案
  • Transformer实战——BERT模型详解与实现
  • 鸿蒙网络编程系列59-仓颉版TLS回声服务器示例
  • deepseek+飞书多维表格 打造小红书矩阵
  • [源力觉醒 创作者计划]_文心大模型4.5开源:从技术突破到生态共建的国产AI解读与本地部署指南
  • AI药师助手 + 药品图谱系统完整操作分析(python版)
  • 【数据可视化-74】电信用户流失数据可视化分析:Python + Pyecharts 炫酷大屏(含完整的数据,代码)
  • 【安装软件系列】Ubuntu安装MongoDb
  • 姑苏区人工智能大模型基础设施|参数1-3:服务器整体
  • React--》规划React组件库编码规范与标准 — Button篇
  • 第十三讲:C++多态
  • 多个参数组合生成sql的方法
  • BERT 的 NSP慢慢转换为SOP
  • arm v3 smmu 图示
  • Android四大组件之BroadcastReceiver解析
  • [2025CVPR]HUGNet2架构:事件相机光流估计
  • 智能落地扇方案:青稞RISC-V电机 MCU一览
  • Java 10 新特性解析
  • 【嵌入式电机控制#18】有刷直流串级控制
  • Redis的持久化策略-AOF和RDB(详细图解)
  • 同创永益 IStorM Chaos 混沌工程平台智能化:智能实验工作台,多智能体协作,筑牢系统稳定性防线
  • [css]旋转流光效果
  • RabbitMQ 消息持久化的三大支柱 (With Spring Boot)
  • 焊接机器人智能化气体节约方案
  • arm smmu v3 队列实现机制
  • 【Linux知识】Linux Shell 脚本中的 `set -ex` 命令深度解析
  • Spark SQL 数组函数合集:array_agg、array_contains、array_sort…详解
  • 水仙花数(python)
  • CMake 完全实战指南:从入门到精通
  • Linux重定向的理解