当前位置: 首页 > news >正文

目标识别笔记

一、目标检测核心概念

  • 定义:识别图像中物体的类别并定位其位置(边界框)。

  • 多任务:分类 + 定位。

  • 挑战

    • 目标种类与数量繁多

    • 目标尺度差异大

    • 遮挡、噪声干扰


二、常用数据集

数据集特点
VOC20类,常用于早期研究
COCO80类,图像多、目标密集,更具挑战性

三、标注格式(Ground Truth)

  • YOLO:归一化中心坐标 + 宽高 (x, y, w, h)

  • VOC:绝对坐标 (Xmin, Ymin, Xmax, Ymax)

  • COCO:绝对坐标 (Xmin, Ymin, W, H)


四、评估指标

  • IoU:衡量预测框与真实框的重合度

  • Precision & Recall:查准率与查全率

  • AP:平均精度,常用11点法计算

  • mAP:所有类别AP的均值,核心评估指标


五、传统方法:滑动窗口

  • 缺点:冗余计算多、定位不准、需人工设计窗口尺寸


六、深度学习方法

1. Anchor-based
  • 使用预设的 anchor boxes 进行目标定位

  • 典型方法:Faster R-CNN, YOLOv2-v4, SSD

2. Anchor-free
  • 不依赖预设 anchor,直接预测目标位置

  • 典型方法:YOLOv1, CenterNet, FCOS

3. Two-stage vs One-stage
  • Two-stage:先提候选区域,再分类与回归(精度高,速度慢)

    • 如:R-CNN系列

  • One-stage:端到端直接输出检测结果(速度快,精度稍低)

    • 如:YOLO系列, SSD


七、后处理技术:NMS

  • 用于去除重叠的冗余检测框

  • 步骤:按置信度排序 → 选取最高框 → 抑制高IoU框 → 重复

http://www.dtcms.com/a/487201.html

相关文章:

  • 考研408《计算机组成原理》复习笔记,第五章(5)——CPU的【微程序控制器】
  • 做网站page庆阳东道设计
  • 从1G到5G:移动通信技术的迭代史诗与未来展望
  • 深入理解 Java 类加载与垃圾回收机制:从原理到实践
  • 手机wap网站模板 带后台台州椒江做网站
  • 苏州网站推广公司东营住建局官网
  • 配置的前世今生:从逻辑中抽离,又与逻辑有限融合
  • 十三、kubernetes 1.29 之 存储 storageClass存储类、补全命令
  • Kotlin中的flow、stateflow、shareflow之间的区别和各自的功能
  • 一般网站建设的流程图wordpress账号和站内网
  • 复习总结最终版:Linux软件编程
  • 索泰显卡,索泰 firestorm 官方下载
  • 网站建设的主要内容包括网页框架结构有哪些
  • 公司做一个网站企业网站制作哪些公司制作
  • 青岛做外贸网站建设wordpress订阅关闭
  • 【个人成长笔记】在Ubuntu中的Linux系统安装实验室WIFI驱动安装(Driver for Linux RTL8188GU)
  • 腾讯音视频功能有哪些
  • 网站建设的流程与思路完美代码网站
  • 基于 GitLab CI/CD 与 Google Gemini 的 AI Code Review 自动化方案
  • 【Vue专题】前端JS基础Part1(含模版字符串、解构赋值、变量常量与对象)
  • 婚庆网站开发背景wordpress怎么改后台
  • 0.2、​​AI Agent 开发中 ReAct 和 MAS 的概念
  • 网站源码风险哈尔滨 门户网站
  • 那些企业网站做的漂亮怎么做免费公司网站
  • 【Go】--扩容机制
  • 网站上哪个做相片书好哈尔滨信息网租房信息
  • 电子商城官方网站做网站的需要什么资质证明
  • 外贸网站制作需求wordpress设置多语言
  • 怎么提Issue与PR
  • wordpress建站资源漂亮的网站设计