当前位置: 首页 > news >正文

【SOD】目标检测

一、SOD任务的含义、特性、分类

小目标的定义

将目标物的bbox表示为(x,y,w,h)(x,y,w,h)x,y,w,h
小目标:短边长度不小于4像素,长边不超过32像素。
min(w,h)≥4pixelmax(w,h)≤32pixel min(w,h) \ge 4 pixel \\ max(w,h) \le 32 pixel min(w,h)4pixelmax(w,h)32pixel

学术界还细分为:

  • 小目标检测:SOD(Small Object Detection)
  • 微小目标检测:TOD(Tiny Object Detection)

但具体的标准没有明确的标准,这里都统称为小目标检测

小目标的特性

  1. 小目标之间的交叠概率比较低,即使有交叠,其IoU多数情况下也是比较小的
    在这里插入图片描述
    在这里插入图片描述
  2. 小目标自身的纹理显著度有强弱区别,但是总体来说纹理特征都较弱,很多时候需要借助一定的图像上下文来帮助确认

在这里插入图片描述
如图左侧的图片,人都很难判断是什么。但是不断添加上下文信息,看到人的身体轮廓,人肉眼就能识别出是人脸。

小目标的分类

分类依据:

  1. 图像上下文的依赖程度
  • 比如微小人脸,他是人身体的一部分,所以有身体就能确定是人脸。
  • 而微小人体,背景可以随意换,所以上下文变化很大,依赖程度低。
  • 一般目标是a bart of类的,就都是上下文依赖程度强的。
  1. 自身纹理显著程度
  • 比如飞机,轮廓特征就很明显,纹理特征显著。
  • 车辆就是一个矩形,很容易和其他物体混淆。
    在这里插入图片描述

二、基于感受野的理论推出一系列网络设计原则

做任何尺寸目标的检测任务,模型都需要达到一定的感受野。
由于有效感受野不能被精确计算,所以理论感受野必须要大于目标尺度。
要达到某个固定的理论感受野数值,网络结构如何设计。

思考小目标检测backbone的设计

这里只选取两个层,

  • 3x3步长为1的卷积
  • 3x3步长为2的卷积,用于下采用
    在这里插入图片描述

基本认识:在不考虑宽度的情况下,网络深度越深,通常来说更有利于特征学习

在这里插入图片描述

三、增强、增多对小目标的学习

http://www.dtcms.com/a/357019.html

相关文章:

  • 2025.8.29机械臂实战项目
  • 基于STM32单片机的智能温室控制声光报警系统设计
  • leetcode 461 汉明距离
  • 基于MSRDCN、FEAM与AMSFM的轴承故障诊断MATLAB实现
  • 【工具】开源大屏设计器 自用整理
  • golang接口详细解释
  • websocket的应用
  • 【Spring Cloud Alibaba】前置知识
  • 微信小程序调用蓝牙打印机教程(TSPL命令)
  • Android 14 PMS源码分析
  • Linux-搭建DNS服务器
  • 计算机三级嵌入式填空题——真题库(24)原题附答案速记
  • CMake xcode编译器属性设置技巧
  • JavaScript 数组核心操作实战:最值获取与排序实现(从基础到优化)
  • 线程安全及死锁问题
  • Linux之Docker虚拟化技术(二)
  • Python结构化模式匹配:解析器的革命性升级
  • 大模型 “轻量化” 之战:从千亿参数到端侧部署,AI 如何走进消费电子?
  • 【ACP】2025-最新-疑难题解析-11
  • 机器视觉opencv教程(二):二值化、自适应二值化
  • Partner 类开发:会议参与者可视化控件
  • 经典扫雷游戏实现:从零构建HTML5扫雷游戏
  • 科技大会用了煽情BGM
  • 【技术分享】系统崩溃后产生的CHK文件如何恢复?完整图文教程(附工具推荐)
  • 论文阅读:GOAT: GO to Any Thing
  • 智慧工地系统:基于Java微服务与信创国产化的建筑施工数字化管理平台
  • 开关电源设计“反馈回路”部分器件分析
  • Nginx的主要配置文件nginx.conf详细解读——及其不间断重启nginx服务等操作
  • 从Cloudflare到EdgeOne:我的个人站点加速之旅与性能对比实测
  • LeetCode Hot 100 Python (11~20)