当前位置: 首页 > news >正文

目标检测(一)

1. 目标检测是什么?

简单说就是 “认出图片里的物体,还找到它们在哪儿”,要同时完成 “定位置” 和 “辨类别” 两个任务,还会面临物体种类数量多、大小不一、被遮挡或有噪声干扰等难题。

2. 常用数据集

有三个常用的标注好的 “练习数据” 库:

  • VOC 数据集:分 4 大类、20 小类,2007 版有近万张图、2 万多个目标,2012 版图和目标更多;
  • COCO 数据集:微软 2014 年搞的,有 20 万张图、80 个类别,超 50 万个目标,平均每张图有 7.2 个目标;
  • 还有 “Ground Truth”(真实标注):记录物体类别和位置,不同格式记录方式不同 ——YOLO 用归一化的中心点 + 宽高,VOC 用左上角 + 右下角坐标,COCO 用未归一化的左上角 + 宽高。

3. 怎么判断检测得好不好?

用一系列 “评估指标”:

  • IoU:看预测框和真实框重叠多少,重叠率是判断框准不准的关键;
  • TP/FP/TN/FN:TP 是 “真的检测对了”(IoU 超阈值),FP 是 “假阳性”(把不是目标的当成目标),TN 是 “真的没目标”,FN 是 “漏检”(没找到真实目标);
  • Precision/Recall:Precision 是 “检测对的比例”(查准率),Recall 是 “找全真实目标的比例”(查全率),还会画 P-R 曲线看整体表现;
  • AP 和 mean AP:AP 是单个类别的平均表现(常用 11 点法计算),mean AP 是所有类别的 AP 求平均。

4. 目标检测的方法

分 “传统方法” 和 “深度学习方法”:

  • 传统方法:主要是 “滑动窗口法”,要人工设窗口尺寸,会做很多重复操作,定位还不准;
  • 深度学习方法
    • 先分 “anchor-base”(先预设很多框,再筛选)和 “anchor-free”(不用预设,自动找目标);
    • 再按流程分 “two stage”(两步走:先找可能有目标的区域,再判断类别和位置,比如 R-CNN 系列)和 “one stage”(一步到位:直接从图里出结果,比如 YOLO、SSD 系列);
    • 最后都会用 “NMS(非极大值抑制)”:去掉重复的框 —— 先按置信度排序,留最高的,删掉和它重叠多的,反复到没重复框。
http://www.dtcms.com/a/487439.html

相关文章:

  • 石家庄免费做网站专做药材的网站有哪些
  • 基本功 | 一文讲清多线程和多线程同步
  • 360门户网站怎样做广州百度seo代理
  • C++蓝桥杯之函数与递归
  • Oracle AWR报告分析:诊断RAC Global cache log flush性能故障
  • python - 第四天
  • 领取流量网站药剂学教学网站的建设
  • 端端网站开发网络广告网站怎么做
  • threejs(五)纹理贴图、顶点UV坐标
  • debug - MDK - arm-none-eabi - 将MDK工程编译过程的所有命令行参数找出来
  • 网站怎么维护百度会收录双域名的网站么
  • Oracle数据库基本命令的8个模块
  • Vue3中的计算属性和监视属性【5】
  • Docker部署WordPress及相关配置
  • 大自然的网站设计营销型企业网站源码
  • 网站如何做线上支付功能免费刷推广链接的网站
  • 使用Flask部署PyTorch模型
  • 新版视频直播点播平台EasyDSS用视频能力破局!
  • python_视频切分
  • vscode 侧边文件夹名字体大一点
  • C++ 进阶特性深度解析:从友元、内部类到编译器优化与常性应用
  • Linux 线程与页表
  • 做产地证的网站江苏和住房建设厅网站
  • 西安网站制作开发深圳专业建站多少钱
  • QT for Android 安卓开发之调用Java程序
  • 攻防世界-Web-题目名称-文件包含
  • **云迁移之旅:探索发散创新的路径**随着云计算技术的日益成熟,越来越多的企业开始
  • 实例分割演进史:从Mask R-CNN到多模态通用分割(2017-2025)
  • 西安高端网站设计公司设一个网站需要多少钱
  • 石家庄平山网站推广优化大连外贸网站制作