当前位置: 首页 > news >正文

目标检测2

1. 目标检测基本概念


定义:识别图片中的物体并定位其位置
多任务特性:位置定位 + 类别识别
主要挑战:
目标种类与数量繁多
目标尺度不均
遮挡、噪声等外部环境干扰

2. 主要数据集

VOC数据集
PASCAL VOC挑战赛数据集
4大类,20小类
VOC 2007: 9963张图片,24640个目标
VOC 2012: 23080张图片,54900个目标

COCO数据集
微软标注的MS COCO数据库
20万个图像,80个类别
超过50万个目标标注
平均每个图像7.2个目标

3. 标注格式

三种主要格式:
1. YOLO(TXT):归一化的(x,y,w,h) - 中心点坐标和宽高
2. VOC(XML):(Xmin,Ymin,Xmax,Ymax) - 左上角和右下角坐标
3. COCO(JSON):(Xmin,Ymin,W,H) - 非归一化的左上角坐标和宽高

4. 评估指标

核心指标:
IoU(交并比):边界框正确性度量
Precision(准确率):查准率
Recall(召回率):查全率
P-R曲线:精度-召回率曲线
AP(Average Precision):平均精度
mAP(mean AP):各类别AP的均值

AP计算方法:
11点法:在召回率[0,1]区间取11个点计算平均精度
评估流程:IoU划分TP/FP → 按置信度排序 → 计算P/R → 绘制P-R曲线 → 计算AP

5. 检测方法演进

传统方法:
滑动窗口法:人工设计尺寸,大量冗余操作,定位不准确

深度学习方法:

Anchor-based方法:
使用anchor box描述目标
ratio + scale描述位置和形状
自顶向下,类似滑动窗口穷举

Anchor-free方法:
自底向上,自动生成
无需预设anchor过程

Two-stage算法:
经典发展线:R-CNN → SPP-Net → Fast R-CNN → Faster R-CNN
其他:Cascade R-CNN、Guided Anchoring

One-stage算法:
YOLO系列:v1-v5
SSD系列:SSD、DSSD、FSSD
其他:RefineDet

6. 关键技术

非极大值抑制(NMS):
1. 设置置信度阈值(通常0.5)
2. 按置信度降序排列候选框
3. 选取最高置信度框加入输出列表
4. 删除与选中框IoU大于阈值的候选框
5. 重复直到候选框为空

http://www.dtcms.com/a/490304.html

相关文章:

  • 12-用户管理
  • 合肥哪里做网站西安网站建设制作专业公司
  • 中冶东北建设网站装修网站运营
  • Nginx+Lua动态加载黑名单
  • 吕口*了多乐*-(话题)程序系统架构方案
  • Java Spring 框架的`@Autowired` 注解 以及依赖注入分析
  • [Docker集群] Docker 数据持久化
  • MCP vs. API:AI智能体如何更轻松地连接外部世界?
  • 【XR硬件系列】破局“芯”瓶颈:深入浅出解析XR专用芯片的必然性
  • 浙江省建设培训中心的网站小程序开发公司简介
  • Redis 限流解决方案:结合 Lua 脚本、AOP 和自定义注解的实现
  • 游戏画面卡顿残影?这款电竞显示器610Hz + 4K OLED
  • COLMAP原理讲解与使用教程
  • 定位守护童年,科技构筑安全屏障
  • AWS EC2 Jenkins 自动化部署与 Python 环境管理
  • Linux中快速部署Elasticsearch(基础TLS配置)
  • 2025吉比特-游戏引擎开发-一面复盘
  • java数据结构--List的介绍
  • 网站主页不收录肥城房产网
  • 计算机视觉(opencv)——基于 MediaPipe 的实时面部表情识别
  • C++设计模式_行为型模式_观察者模式Observer(发布-订阅(Publish-Subscribe))
  • 怎么解决ModuleNotFoundError: No module named ‘Cython‘
  • 电子商务网站规划流程手机主题制作网站
  • 微信小程序 Button 组件 open-type 完全指南:从用户信息获取到客服分享的实战应用
  • 阿里云白皮书-架构
  • Rokid 开发空间小程序 实战
  • RAG系统搭建指南:5种主流框架的易用性和效果对比
  • 网站后台怎么添加代码哪里有免费的域名注册建网站
  • Jetson AGX Orin+GMSL+AI视觉开发套件,支持自动驾驶,机器人,工业视觉等应用
  • 【JETSON+FPGA+GMSL+AI】自动驾驶与移动机器人的摄像头如何实现高精度时间同步?