当前位置: 首页 > news >正文

小土堆目标检测笔记

文章目录

    • 1 什么是目标检测
    • 2 目标检测常见的数据集
      • 2.1 目标检测数据集
      • 2.2 目标检测数据集的标注
      • 2.3 目标检测工具介绍

1 什么是目标检测

希望计算机在视频或图像中定位并识别我们感兴趣的目标
定位:找到目标在图像中的位置。
在这里插入图片描述
识别:识别矩阵框中的内容
在这里插入图片描述
感兴趣的目标:不仅是一些常规的目标,也可以是一些非常规的目标或者是抽象的目标。

2 目标检测常见的数据集

2.1 目标检测数据集

数据集涉及到输入和输出
输入:图片
输出:带有目标的标注
在这里插入图片描述
博主提到的数据集网站paperswitchcode停止维护
找到了保存往期的paperwithcode网页快照,还能使用以前的功能
https://web.archive.org/web/20250616051252/https://paperswithcode.com/
在这里插入图片描述
VOC数据集,找了个能用的链接,需要登录Google
https://www.kaggle.com/search?q=voc+in%3Adatasets
在这里插入图片描述
在标注的xml文件中,truncated表示能否标注完整(0标注完整),difficult表示是否能够容易识别(0容易识别)
在这里插入图片描述

imagej工具下载链接
https://imagej.net/ij/download.html
在这里插入图片描述
目标框选
在这里插入图片描述
在这里插入图片描述
土堆的VOC数据集查看器
https://xiaotudui.com/tuduilab/voc-dataset-viewer
在这里插入图片描述

2.2 目标检测数据集的标注

YOLO格式的标注,会将x_yolo,y_yolo,width_yolo,hight_yolo进行一个归一化的处理,将范围控制在[0,1],(Xcenter/ImageWidth,Ycenter/ImageHight,Width/ImageWidth,Hight/ImageHight)
在这里插入图片描述
YOLO标注例子
在这里插入图片描述
YOLO格式<class_id,x_yolo,y_yolo,width_yolo,hight_yolo>
0 0.5 0.54 0.406 0.5135
在这里插入图片描述

2.3 目标检测工具介绍

labellmg标注工具的使用
采集自己的数据集
明确任务–检测没有不带头盔的驾驶员,并检测出摩托车车牌
抽象出感兴趣的目标,摩托车

  1. 不带头盔的人 class id 0 no helmet
  2. 摩托车 class id 1 motor
  3. 摩托车车牌 class id 2 number
  4. 带头盔的人 class id 3 with helmet

标注工具,从up网盘下载
Labellmg
修改一下自己所需要的标签
在这里插入图片描述
Open Dir打开目录,Change Save Dir切换保存后的标注路径,通过create框出感兴趣目标,切换YOLO(txt)/VOC(xml)标注格式
在这里插入图片描述
labelstudio工具的使用
在python的虚拟环境中安装labelstudio

pip install -U label-studio

在这里插入图片描述

启动labelstudio

label-studio

在这里插入图片描述
在这里插入图片描述
通过导入的形式将未标定的数据集导入到labelstudio中,设置标签的类别进行标注
在这里插入图片描述
标注完成后的导出格式
在这里插入图片描述
本地的挂载和网盘的挂载适合大批量的数据集
设置-Cloud Storage-Add Source Storage
Absolute local path路径要和虚拟环境放在一个盘里
在这里插入图片描述
设置环境变量
LOCAL_FILES_SERVING_ENABLED=True
在这里插入图片描述
重新启动继续导入,点击Sync Storage同步数据
在这里插入图片描述
添加标签
在这里插入图片描述

http://www.dtcms.com/a/361165.html

相关文章:

  • 【开题答辩全过程】以 基于Spring Boot的房屋租赁系统的设计与实现为例,包含答辩的问题和答案
  • go语言面试之Goroutine 数量控制, GC回收 和任务调度
  • 【Qwen】Qwen3-30B-A3B 模型性能评估指南 + API KEY介绍
  • DAY02:【DL 第一弹】pytorch
  • JS闭包讲解
  • 在 Halo 中导入 Markdown 和 Word 文档
  • openEuler2403编译安装Nginx
  • 【C++】 Vector容器操作全解析
  • springboot:数据校验
  • 人工智能之数学基础:常用的连续型随机变量的分布
  • Web知识的总结
  • 直播预告 | Excelize 跨语言实战
  • 搭载AX650N高能效比智能视觉芯片——AX2050系列边缘计算盒,可应用在智慧安防交通仓储教育,人脸识别,明厨亮灶,安全生产,智能机器人等
  • Linux ARP老化机制/探测机制/ip neigh使用
  • 前端性能优化实战:如何高效管理和加载图片、字体、脚本资源
  • 数组(4)
  • 重构导航之核:高德地图的深度学习架构解析 导论:从数字化世界到可计算世界
  • TensorFlow深度学习实战(36)——自动机器学习(AutoML)
  • 从能耗黑洞到精准智控:ASCB2智慧空开重构高校宿舍用电能效模型
  • 英伟达Newton与OpenTwins如何重构具身智能“伴随式数采”范式
  • PHP 日志最佳实践
  • 【项目】多模态RAG必备神器—olmOCR重塑PDF文本提取格局
  • 江协科技STM32学习笔记补充之001。为什么C语言在对STM32编程过程中的二进制要用十六进制来进行读写。而不能直接用二进制来进行读写。
  • [Linux]学习笔记系列 -- mm/slub.c SLUB内存分配器(The SLUB Allocator) 现代内核对象缓存的核心
  • 【开题答辩全过程】以 基于php的校园兼职求职网站为例,包含答辩的问题和答案
  • 《梨树下的家》文学分析与研究
  • MVC问题记录
  • Linux初始——编译器gcc
  • [Java]PTA:jmu-java-01入门-基本输入
  • Spark自定义累加器实现高效WordCount