小土堆目标检测笔记
文章目录
- 1 什么是目标检测
- 2 目标检测常见的数据集
- 2.1 目标检测数据集
- 2.2 目标检测数据集的标注
- 2.3 目标检测工具介绍
1 什么是目标检测
希望计算机在视频或图像中定位并识别我们感兴趣的目标
定位:找到目标在图像中的位置。
识别:识别矩阵框中的内容
感兴趣的目标:不仅是一些常规的目标,也可以是一些非常规的目标或者是抽象的目标。
2 目标检测常见的数据集
2.1 目标检测数据集
数据集涉及到输入和输出
输入:图片
输出:带有目标的标注
博主提到的数据集网站paperswitchcode停止维护
找到了保存往期的paperwithcode网页快照,还能使用以前的功能
https://web.archive.org/web/20250616051252/https://paperswithcode.com/
VOC数据集,找了个能用的链接,需要登录Google
https://www.kaggle.com/search?q=voc+in%3Adatasets
在标注的xml文件中,truncated表示能否标注完整(0标注完整),difficult表示是否能够容易识别(0容易识别)
imagej工具下载链接
https://imagej.net/ij/download.html
目标框选
土堆的VOC数据集查看器
https://xiaotudui.com/tuduilab/voc-dataset-viewer
2.2 目标检测数据集的标注
YOLO格式的标注,会将x_yolo,y_yolo,width_yolo,hight_yolo进行一个归一化的处理,将范围控制在[0,1],(Xcenter/ImageWidth,Ycenter/ImageHight,Width/ImageWidth,Hight/ImageHight)
YOLO标注例子
YOLO格式<class_id,x_yolo,y_yolo,width_yolo,hight_yolo>
0 0.5 0.54 0.406 0.5135
2.3 目标检测工具介绍
labellmg标注工具的使用
采集自己的数据集
明确任务–检测没有不带头盔的驾驶员,并检测出摩托车车牌
抽象出感兴趣的目标,摩托车
- 不带头盔的人 class id 0 no helmet
- 摩托车 class id 1 motor
- 摩托车车牌 class id 2 number
- 带头盔的人 class id 3 with helmet
标注工具,从up网盘下载
Labellmg
修改一下自己所需要的标签
Open Dir打开目录,Change Save Dir切换保存后的标注路径,通过create框出感兴趣目标,切换YOLO(txt)/VOC(xml)标注格式
labelstudio工具的使用
在python的虚拟环境中安装labelstudio
pip install -U label-studio
启动labelstudio
label-studio
通过导入的形式将未标定的数据集导入到labelstudio中,设置标签的类别进行标注
标注完成后的导出格式
本地的挂载和网盘的挂载适合大批量的数据集
设置-Cloud Storage-Add Source Storage
Absolute local path路径要和虚拟环境放在一个盘里
设置环境变量
LOCAL_FILES_SERVING_ENABLED=True
重新启动继续导入,点击Sync Storage同步数据
添加标签