当前位置: 首页 > news >正文

深度学习目标检测项目

本次学习是围绕深度学习目标检测,从基础概念到技术细节、评估指标及主流方法逐一阐述,系统呈现目标检测领域核心知识。

一、目标检测核心定义与挑战

  1. 核心任务:不仅要识别图片中物体的类别,还需确定物体的位置,属于 “位置 + 类别” 的多任务问题。
  2. 关键挑战:面临目标种类与数量繁多、目标尺度不均,以及遮挡、噪声等外部环境干扰等问题,增加了检测难度。

二、主流数据集介绍

  1. VOC 数据集:源于 PASCAL VOC 挑战赛,包含 4 大类、20 小类目标;VOC 2007 有 9963 张图片、24640 个目标,VOC 2012 则有 23080 张图片、54900 个目标,为早期目标检测研究提供重要数据支撑。
  2. COCO 数据集:由微软 2014 年出资标注,涵盖 20 万个图像、80 个类别,超过 50 万个目标标注,且平均每个图像含 7.2 个目标,数据规模更大、类别更丰富,满足复杂场景下的模型训练需求。

三、Ground Truth 格式

Ground Truth 包含物体类别与真实边界框坐标,不同数据集格式不同:

  1. YOLO(TXT)格式:坐标为(x,y,w,h),分别代表中心点坐标和宽、高,且均经过归一化处理。
  2. VOC(XML)格式:以(Xmin,Ymin,Xmax,Ymax)表示,对应边界框左上角和右下角坐标。
  3. COCO(JSON)格式:坐标为(Xmin, Ymin, W, H),x,y 代表左上角坐标,w,h 为宽和高,且未做归一化。

四、评估指标体系

  1. IoU(Intersection over Union):衡量预测边界框与真实边界框的重叠程度,先过滤低类别置信度检测结果,再以 IoU 判断边界框正确性。
  2. TP、FP、TN、FN 定义:TP 指 IoU > 阈值的正样本预测,FP 为 IoU < 阈值的负样本误判为正样本,TN 是负样本正确预测,FN 为正样本漏检。
  3. Precision 与 Recall:Precision(查准率)反映预测正样本的准确性,Recall(查全率)体现对真实正样本的覆盖程度,二者可通过 P-R 曲线展示;mean AP 是所有类别 AP 的算术平均值,AP 计算常用 11 点法(取召回率 0-1 间隔 0.1 的 11 个点对应的精度均值)等方法。
  4. mean 与 average 区别:mean 为简单算术平均,average 包含更多度量规则;AP 需设计规则均衡,mean AP 因 AP 已较均衡,直接算术平均即可。

五、目标检测方法演进

  1. 传统方法:以滑动窗口法为代表,需人工设计窗口尺寸,存在大量冗余操作,且定位准确性低,难以满足复杂检测需求。
  2. 深度学习方法
  3. Anchor 相关:Anchor box 通过 ratio(长宽比)和 scale(面积大小)描述,基于 feature map 点确定位置;分为 anchor-base(自顶向下,类似滑动窗口法穷举后筛选)和 anchor-free(自底向上,自动生成无需预设)两类。
  4. 算法流程:分为 two stage 和 one stage。two stage 先生成候选区域(proposal),经 ROI pooling 后进行类别预测与位置回归,最后通过 NMS 筛选,代表算法有 R-CNN 系列、Cascade R-CNN 等;one stage 直接对图像进行处理,同步完成类别预测与位置回归,再经 NMS 优化,代表算法包括 YOLO 系列、SSD 系列等。
  5. NMS(非极大值抑制):先设定置信度阈值(常用 0.5),按置信度降序排列候选框;选取置信度最高的框加入输出列表并删除,计算剩余框与该框的 IoU,删除 IoU 大于阈值的框;重复操作至候选框为空,得到最终检测结果,用于去除冗余候选框。
http://www.dtcms.com/a/486056.html

相关文章:

  • SQL 窗口函数
  • 盟接之桥浅谈目标落地的底层逻辑:实践、分解与认知跃迁
  • 【Qt】4.项目文件解析
  • Redis-布隆过滤器BloomFilter
  • 网站建设找至尚网络深圳制作企业网站
  • 网页是网站吗苏州刚刚发生的大事
  • WPF中RelayCommand的实现与使用详解
  • 百度天气:空气质量WebGIS可视化的创新实践 —— 以湖南省为例
  • Flutter---GridView+自定义控件
  • OJ竞赛平台----C端题目列表
  • 【完整源码+数据集+部署教程】行人和斑马线检测系统源码和数据集:改进yolo11-RFCBAMConv
  • 做海淘的网站做海淘的网站网站建设案例步骤
  • [Zer0pts2020]Can you guess it?
  • Go 通道非阻塞发送:优雅地处理“通道已满”的场景
  • 设计模式【工厂模式和策略模式】
  • 【Go】P6 Golang 基础:流程控制
  • Perl 基础语法
  • 酒店网站模板网站开发好的语言
  • C++入门——多态
  • 用数据绘图(1):用 Highcharts 打造你的数据艺术世界
  • Hadoop面试题及详细答案 110题 (96-105)-- Hadoop性能优化
  • 监控系统理论与实践:从认知到Zabbix入门
  • ROS 传感器模块的通用架构设计与跨中间件扩展实践
  • 措美网站建设游戏网站开发名字
  • openwrt 环境安装
  • iis 发布网站内部服务器错误东莞沙田门户网站建设
  • 订单 API 接口调试常见问题排查:3 类高频问题 + 落地解决方案
  • JavaWeb--使用JDBC操作数据库(一)
  • 【Web开发】待办事项列表
  • Linux IIO研究(二)