当前位置：首页 > news >正文

目标识别笔记

news 2025/10/16 9:55:49

一、目标检测核心概念

定义：识别图像中物体的类别并定位其位置（边界框）。
多任务：分类 + 定位。
挑战：
- 目标种类与数量繁多
- 目标尺度差异大
- 遮挡、噪声干扰

二、常用数据集

数据集	特点
VOC	20类，常用于早期研究
COCO	80类，图像多、目标密集，更具挑战性

三、标注格式（Ground Truth）

YOLO：归一化中心坐标 + 宽高 (x, y, w, h)
VOC：绝对坐标 (Xmin, Ymin, Xmax, Ymax)
COCO：绝对坐标 (Xmin, Ymin, W, H)

四、评估指标

IoU：衡量预测框与真实框的重合度
Precision & Recall：查准率与查全率
AP：平均精度，常用11点法计算
mAP：所有类别AP的均值，核心评估指标

五、传统方法：滑动窗口

缺点：冗余计算多、定位不准、需人工设计窗口尺寸

六、深度学习方法

1. Anchor-based

使用预设的 anchor boxes 进行目标定位
典型方法：Faster R-CNN, YOLOv2-v4, SSD

2. Anchor-free

不依赖预设 anchor，直接预测目标位置
典型方法：YOLOv1, CenterNet, FCOS

3. Two-stage vs One-stage

Two-stage：先提候选区域，再分类与回归（精度高，速度慢）
- 如：R-CNN系列
One-stage：端到端直接输出检测结果（速度快，精度稍低）
- 如：YOLO系列, SSD

七、后处理技术：NMS

用于去除重叠的冗余检测框
步骤：按置信度排序 → 选取最高框 → 抑制高IoU框 → 重复

查看全文

http://www.dtcms.com/a/487201.html

考研408《计算机组成原理》复习笔记，第五章(5)——CPU的【微程序控制器】

做网站page庆阳东道设计

从1G到5G：移动通信技术的迭代史诗与未来展望

深入理解 Java 类加载与垃圾回收机制：从原理到实践

手机wap网站模板带后台台州椒江做网站

苏州网站推广公司东营住建局官网

配置的前世今生：从逻辑中抽离，又与逻辑有限融合

十三、kubernetes 1.29 之存储 storageClass存储类、补全命令

Kotlin中的flow、stateflow、shareflow之间的区别和各自的功能

一般网站建设的流程图wordpress账号和站内网

复习总结最终版：Linux软件编程

索泰显卡，索泰 firestorm 官方下载

网站建设的主要内容包括网页框架结构有哪些

公司做一个网站企业网站制作哪些公司制作

青岛做外贸网站建设wordpress订阅关闭

【个人成长笔记】在Ubuntu中的Linux系统安装实验室WIFI驱动安装（Driver for Linux RTL8188GU）

腾讯音视频功能有哪些

网站建设的流程与思路完美代码网站

基于 GitLab CI/CD 与 Google Gemini 的 AI Code Review 自动化方案

【Vue专题】前端JS基础Part1（含模版字符串、解构赋值、变量常量与对象）

婚庆网站开发背景wordpress怎么改后台

0.2、AI Agent 开发中 ReAct 和 MAS 的概念

网站源码风险哈尔滨门户网站

那些企业网站做的漂亮怎么做免费公司网站

【Go】--扩容机制

网站上哪个做相片书好哈尔滨信息网租房信息

电子商城官方网站做网站的需要什么资质证明

外贸网站制作需求wordpress设置多语言

怎么提Issue与PR

wordpress建站资源漂亮的网站设计

一、目标检测核心概念

二、常用数据集

三、标注格式（Ground Truth）

四、评估指标

五、传统方法：滑动窗口

六、深度学习方法

1. Anchor-based

2. Anchor-free

3. Two-stage vs One-stage

七、后处理技术：NMS

相关文章：