当前位置: 首页 > news >正文

开放词汇检测分割YOLOE从pytorch到caffe

开放词汇检测分割YOLOE从pytorch到caffe

  • 0. 前沿
    • 开放词汇检测的概念
    • CLIP模型
  • 1. YOLOE 环境配置
    • 1.1 虚拟环境
    • 1.2 YOLOE 模型推理测试
      • 1.2.1 文本提示检测和分割测试
      • 1.2.2 无提示检测和分割
  • 2.YOLOE网络结构分析
    • 2.1 网络结构概述
    • 2.2 可重参数化区域-文本对齐(Re-parameterizable region-text alignment: RepRTA)
    • 2.3 语义激活视觉提示编码器(Semantic-activated visual prompt encoder: SAVPE)
    • 2.4 懒惰区域-提示对比(Lazy region-prompt contrast: LRPC)
  • 3. YOLOE模型导出
    • 3.1 修改head.py
    • 3.2 修改`ultralytics/engine/exporter.py`
    • 3.3 `python export.py `导出onnx模型
  • 4. onnx转caffemodel

0. 前沿

一直在用YOLO系列进行目标检测、分割和关键点检测等任务,基于对YOLO-world的了解,进一步认识了开放词汇检测,简单来说就是在原有固定类别的检测器上进行类别数量提升,基于CLIP的文本embedding能力,可以将任意标签转换为512维度的特征向量,将其与图片目标特征进行对比学习,获得目标的匹配类别。YOLOE在检测的基础上补充了分割任务,能够直接实现实例分割的移植和部署;

在这里插入图片描述
从最后的部署应用来看,在考虑到边缘端的推理效率,采用了重参化移植,export时指定label后,模型的结构和原来的YOLOv8s是一样的,所以总体感觉开放词汇在边缘端还是趋向于闭集检测,优势在于能够进行预标注,对提高新样本的标注效率有一定的帮助。(基于当前认知的感受,后续补充)。本文将针对YOLOE从0到1进行模型的移植部署,整体属于入门级别,没有进行模型微调(微调后会对参与训练的样本精度提升,但其他样本骤降),只对预训练模型进行caffemodel的转换并部

相关文章:

  • Spring状态机
  • Docker简述
  • React Hooks 的原理、常用函数及用途详解
  • Python打卡训练营学习记录Day49
  • 【Elasticsearch】Elasticsearch 在大数据生态圈的地位 实践经验
  • 2025年渗透测试面试题总结-小鹏[社招]车联网工程师(题目+回答)
  • 云南净餐馆备考单选题及答案
  • Ⅳ.计算机二级选择题(函数)
  • 前端开发面试题总结-vue2框架篇(一)
  • C++实现分布式网络通信框架MPRPC(1)--预备知识
  • DL00871-基于深度学习YOLOv11的盲人障碍物目标检测含完整数据集
  • 分布式光纤声振传感技术原理与瑞利散射机制解析
  • MySQL的pymysql操作
  • 如何选择适合你的分页方案
  • Coze 和 Dify 对比
  • NLP-文本表征(2011-2022)
  • Linux 基础入门操作 第十三章 嵌入式数据库介绍1
  • 自然语言处理——Transformer
  • 闭合逻辑检测(保留最大连通分量)
  • 期权怎么判断是不是主力合约?
  • 最好的装饰公司营销型网站/全网营销图片
  • 两款WordPress加速/华为seo诊断及优化分析
  • 湘潭网站建设 要选磐石网络/网络营销网站
  • 有免费的微网站制作吗/优化设计数学
  • 使用vue做单页面网站/百度搜索引擎的使用方法
  • 有什么做兼职的网站比较好/关键词搜索量全网查询