当前位置: 首页 > news >正文

Yolo-Uniow开集目标检测本地复现

本文不生产技术,只做技术的搬运工!!!

前言

        Yolo-Uniow是清华团队前段时间公布的开集目标检测模型,继承了Yolo家族的优秀传统:快,对coco、lvis等开源数据集类别支持良好,本文不介绍原理及论文,仅记录在本地复现过程中出现的问题及解决方案。

环境配置

项目地址:GitHub - THU-MIG/YOLO-UniOW: YOLO-UniOW: Efficient Universal Open-World Object Detection

清华团队提供了环境配置方案,作者做了一些优化,对小白更友好,过程如下:

conda create -n yolouniow python=3.9
conda activate yolouniow
pip install torch==2.1.2 torchvision==0.16.2 --index-url https://download.pytorch.org/whl/cu118
pip install mmcv==2.1.0 -f https://download.openmmlab.com/mmcv/dist/cu118/torch2.1/index.html
git clone https://github.com/THU-MIG/YOLO-UniOW.git
cd YOLO-UniOW
pip install -r requirements.txt
pip install -e .

本地推理(图像)

进行本地推理前需要先下载Yolo-Uniow权重、CLIP权重、lvis文件,其中Yolo-Uniow权重需要在github的链接中下载,CLIP权重是代码自动下载,lvis文件可以百度搜索lvis_v1_minival_inserted_image_name.json,在hugging face上下载,针对网络不好的问题,作者对这三个下载项提供了解决方案,均是免费下载。

Yolo-Uniow权重

https://download.csdn.net/download/qq_44908396/90474170https://download.csdn.net/download/qq_44908396/90474170

CLIP权重

解决OSError: We couldn‘t connect to ‘https://huggingface.co‘ to load this file_we couldn't connect to-CSDN博客文章浏览阅读3.9k次,点赞23次,收藏25次。解决hugging face无法下载模型的问题_we couldn't connect to https://blog.csdn.net/qq_44908396/article/details/142516867?spm=1001.2014.3001.5501

lvis_v1_minival_inserted_image_name.json

https://download.csdn.net/download/qq_44908396/90474156https://download.csdn.net/download/qq_44908396/90474156该文件下载后放在YOLO-UniOW/data/coco/lvis目录下即可

推理脚本

在YOLO-UniOW工程下,新建infer.sh脚本,写入如下内容

python ./demo/image_demo.py \
./configs/pretrain/yolo_uniow_l_lora_bn_5e-4_100e_8gpus_obj365v1_goldg_train_lvis_minival.py \ #配置文件
./demo/yolo_uniow_l_lora_bn_5e-4_100e_8gpus_obj365v1_goldg_train_lvis_minival.pth \ #权重路径
./demo/src.jpg \ #图像路径
'white cars' \ #提示词
--topk 100 \
--threshold 0.05 \ #阈值
--output-dir ./demo/output/ #输出路径

./configs/pretrain/路径下提供了三个配置文件,分别对应三个权重,作者使用的是L模型,因此需要使用L配置文件

执行

conda activate yolouniow
sh infer.sh

相关文章:

  • Kotlin学习笔记之类与对象
  • 【ISP】ISP的pipeline的几种关键算法
  • mysql忘记root密码
  • 企业安全—对数据和资产进行识别和分类
  • 数据结构与算法效率分析:时间复杂度与空间复杂度详解(C语言)
  • 【赵渝强老师】PostgreSQL的模板数据库
  • 【C#学习笔记03】进制转换与反码、补码、原码
  • 数字人源头技术saas厂家开发
  • 木马查杀之AST初识篇
  • UE5.5 Niagara发射器更新属性
  • 迅为RK3568开发板篇Openharmony配置HDF控制UART-实操-HDF驱动配置UART-UART应用开发-UART驱动API接口介绍
  • 四层协议攻防手册:从SYN Flood到UDP反射的深度防御
  • 从前端视角理解消息队列:核心问题与实战指南
  • cesium1.126显示等高线
  • 深度学习基础:线性代数本质2——线性组合、张成的空间与基
  • Linux进程管理15 - CFS调度器2 - 数据结构关系
  • CAMEL 学习笔记一
  • 深入解析 RAG:检索增强生成的原理与应用
  • 【NLP 34、实践 ⑧ 基于faq知识库和文本匹配算法进行意图识别】
  • 如何进行项目风险评估
  • 2025年中国网络文明大会将于6月10日在安徽合肥举办
  • 微软将裁员3%,减少管理层
  • 视频|王弘治:王太后,“先天宫斗圣体”?
  • 央媒评网红质疑胖东来玉石定价暴利:对碰瓷式维权不能姑息
  • 西北大学副校长范代娣成陕西首富?系家庭财富,本人已从上市公司退出
  • 夜读丨取稿费的乐趣