当前位置：首页 > news >正文

小土堆目标检测笔记

news 2025/9/2 6:46:22

文章目录

- 1 什么是目标检测
- 2 目标检测常见的数据集
- - 2.1 目标检测数据集
  - 2.2 目标检测数据集的标注
  - 2.3 目标检测工具介绍

1 什么是目标检测

希望计算机在视频或图像中定位并识别我们感兴趣的目标
定位：找到目标在图像中的位置。
在这里插入图片描述
识别：识别矩阵框中的内容

感兴趣的目标：不仅是一些常规的目标，也可以是一些非常规的目标或者是抽象的目标。

2 目标检测常见的数据集

2.1 目标检测数据集

数据集涉及到输入和输出
输入：图片
输出：带有目标的标注
在这里插入图片描述
博主提到的数据集网站paperswitchcode停止维护
找到了保存往期的paperwithcode网页快照，还能使用以前的功能
https://web.archive.org/web/20250616051252/https://paperswithcode.com/

VOC数据集，找了个能用的链接，需要登录Google
https://www.kaggle.com/search?q=voc+in%3Adatasets
在这里插入图片描述
在标注的xml文件中，truncated表示能否标注完整（0标注完整），difficult表示是否能够容易识别（0容易识别）

imagej工具下载链接
https://imagej.net/ij/download.html
在这里插入图片描述
目标框选

土堆的VOC数据集查看器
https://xiaotudui.com/tuduilab/voc-dataset-viewer

2.2 目标检测数据集的标注

YOLO格式的标注，会将x_yolo,y_yolo,width_yolo,hight_yolo进行一个归一化的处理，将范围控制在[0,1]，（Xcenter/ImageWidth,Ycenter/ImageHight,Width/ImageWidth,Hight/ImageHight）
在这里插入图片描述
YOLO标注例子

YOLO格式<class_id,x_yolo,y_yolo,width_yolo,hight_yolo>
0 0.5 0.54 0.406 0.5135

2.3 目标检测工具介绍

labellmg标注工具的使用
采集自己的数据集
明确任务–检测没有不带头盔的驾驶员，并检测出摩托车车牌
抽象出感兴趣的目标，摩托车

不带头盔的人 class id 0 no helmet
摩托车 class id 1 motor
摩托车车牌 class id 2 number
带头盔的人 class id 3 with helmet

标注工具，从up网盘下载
Labellmg
修改一下自己所需要的标签
在这里插入图片描述
Open Dir打开目录，Change Save Dir切换保存后的标注路径，通过create框出感兴趣目标，切换YOLO（txt）/VOC（xml）标注格式

labelstudio工具的使用
在python的虚拟环境中安装labelstudio

pip install -U label-studio

在这里插入图片描述

启动labelstudio

label-studio

在这里插入图片描述

通过导入的形式将未标定的数据集导入到labelstudio中，设置标签的类别进行标注

标注完成后的导出格式

本地的挂载和网盘的挂载适合大批量的数据集
设置-Cloud Storage-Add Source Storage
Absolute local path路径要和虚拟环境放在一个盘里
在这里插入图片描述
设置环境变量
LOCAL_FILES_SERVING_ENABLED=True

重新启动继续导入，点击Sync Storage同步数据

添加标签