当前位置: 首页 > news >正文

【多尺度/局部-全局融合与优化 】涉及的工业异常检测论文摘要整理

【CVPR2023】WinCLIP: Zero-/Few-Shot Anomaly Classification and Segmentation
摘要:

  • 研究重点: 视觉异常分类与分割 + 研究领域:工业质量检测 +之前的研究重点:为每个质量检测任务训练自定义模型(需要特定任务的图像和注释)
  • 贡献1: 不需要为每个质量检测任务训练自定义模型 + 零样本和少正常样本的异常分类和分割
  • 研究模型:视觉-语言模型CLIP + 优点:有竞争性的零/少样本性能 + 缺点:在异常分类和分割任务上效果不佳
  • 提出新模型:基于窗口的CLIP (WinCLIP)
  • 在这里插入图片描述

1.对状态词和提示模板的组合集成
2.提取和聚合与文本对齐的窗口/补丁/图像级特征
3.提出少样本设置,利用普通图像的互补信息

  • 实验结果: 数据集:MVTec-AD 和 VisA 指标:AUROC, AUPR, F1-max 结果:比当时最好的方法指标要高
    在这里插入图片描述
    跟多样本的方法相比
    在这里插入图片描述
    代码:https://github.com/caoyunkang/WinClip

【ICLR 2024】ANOMALYCLIP: OBJECT-AGNOSTIC PROMPT LEARNING FOR ZERO-SHOT ANOMALY DETECTION
摘要:

  • 研究领域:零样本异常检测(Zero-shot anomaly detection, ZSAD) + 介绍:在目标数据集中没有任何训练样本的情况下,需要使用辅助数据训练的检测模型来检测异常
  • 挑战性:模型需要泛化到不同域的异常(前景对象的外观、异常区域和背景特征:不同产品/器官上的缺陷/肿瘤),不同产品的异常可能会有较大差异
  • 研究模型:预训练视觉-语言模型(vlm)CLIP + 优点:有强大的零样本识别能力 +缺点:ZSAD性能较弱-》分析原因:VLMs更多地关注于建模前景物体的类语义,×图像中的异常/正常现象
  • 提出新模型:AnomalyCLIP【自适应CLIP实现跨不同域的准确ZSAD】
    在这里插入图片描述

1.学习与对象无关的文本提示:无论前景对象如何,都能捕捉图像中的一般正常和异常-》专注于异常图像区域(×目标语义)+ 对不同类型的目标进行泛化的正常和异常识别

  • 实验结果:
    比较方法: CLIP, CLIP-AC, WinCLIP , VAND, and CoOp
    指标:I(AUROC, AP),P(AUROC, PRO)
    工业数据集: MVTec AD ,VisA, MPDD , BTAD, SDD, DAGM, and DTD-Synthetic . In medical imaging, we consider skin cancer detection dataset
    在这里插入图片描述
    医学数据集:
    ISIC, CVC-ClinicDB , CVC-ColonDB , Kvasir , and Endo , TN3k ,HeadCT , BrainMRI , Br35H , and
    COVID-19
    在这里插入图片描述
    代码:https://github.com/zqhang/AnomalyCLIP

【ACM MM 2024】FiLo: Zero-Shot Anomaly Detection by Fine-Grained Description and High-Quality Localization
摘要:

  • 研究领域:零样本异常检测(ZSAD) + 介绍:在不事先访问目标类别内已知的正常或异常样本的情况下检测异常
  • 目前研究情况:1.依赖于预训练的多模态模型 2.计算手工制作的表示“正常”或“异常”语义的文本特征与图像块特征之间的相似性 -》检测异常 + 不足:1.对“异常”的一般描述往往无法精确匹配不同对象类别的不同类型的异常 2.计算单个补丁的特征相似性很难确定各种大小和规模的异常的具体位置
  • 提出新模型:FiLo【ZSAD方法】
    在这里插入图片描述

(1)自适应学习的细粒度描述(FG-Des):利用大型语言模型(LLMs)为每个类别引入细粒度的异常描述 + 采用自适应学习的文本模板
(2)位置增强的高质量定位(HQ-Loc):利用DINO初步定位、位置增强的文本提示
(3)多尺度多形状跨模态交互(Multi-scale Multi-shape Cross-modal Interaction, MMCI)模块 :有利于更准确地定位不同大小和形状的异常

  • 实验结果: 数据集:MVTec和VisA 指标: Image-AUC, Pixel-AUC
    在这里插入图片描述

代码:https://github.com/CASIA-IVA-Lab/FiLo

http://www.dtcms.com/a/399313.html

相关文章:

  • CRI与容器运行时:从Kubelet到Container的最后一公里
  • cnu摄影网站chrome官网
  • 一篇了解 Git 使用方法
  • wordVSTO插件实现自动填充序号
  • 海口网站建设哪家专业灌南住房建设局网站
  • 若依框架 (Spring Boot 3) 集成 knife4j 实现 OpenAPI 文档增强
  • MySQL分库分表详解:从原理、策略到ShardingSphere中间件选型,避坑指南一篇就够了
  • Excel知识体系
  • 零基础网站建设入门到精通视频教《妻子》在线观看免费韩剧
  • AI 大模型驱动的开源知识库搭建系统 PandaWiki的网页挂件机器人教程
  • 甘露园网站建设wordpress文章页面区别
  • 网上做视频赚钱的网站有哪些企查查企业信息
  • 网站生成静态页面工具wordpress menu icons
  • [css] flex 布局设置文字不自动换行
  • Suno V5首发 – V5模型重磅来袭 —— AI 音乐创作进入全新纪元
  • 构建AI智能体:四十二、使用 Qwen-Agent Assistant 调用高德 API 实现天气查询
  • 网站用的服务器网站怎么维护更新
  • Metal - 2. 3D 模型深度解析
  • 做非经营网站需要营业执照莱芜在线沙总
  • 网站建设模板研究玉林市网站开发公司电话
  • 无线数传模块优化挖掘机工厂机械设备的远程监控通讯
  • 【最终章】-串口收发指令处理器-Verilog语法学习EP12
  • 嵌入模型与向量数据库
  • 白山商城网站建设昆明网站建设猫咪
  • git的在工作中使用的一些注意事项
  • 河北网站备案多久wordpress站点管理
  • 力扣300.最长递增子序列(经典dp)力扣375.猜数字II力扣.329矩阵最长的递增子序列力扣.33搜索旋转排序数组
  • Kasaraju 算法详解:强连通分量(SCC)检测与循环依赖分析
  • python+springboot+vue的食物营养分析与推荐网站
  • 网站前端开发工具有哪些?常用网站前端开发工具推荐、网站前端开发工具对比与最佳实践分享