当前位置: 首页 > news >正文

角度回归——八参数检测四边形Gliding Vertex

文章目录

  • 一、介绍
    • (一)五参数检测方法( 基于角度)
    • (二)八参数检测方法(point-based)的边界
  • 二、方案分析
    • (一)问题定义
    • (二)方案
    • (三)Gliding Vertex方案的问题
  • 参考

一、介绍

遥感目标检测Gliding Vertex 是四边形检测器,而且都考虑到了顺序标签点(sequential label points)的问题。我们先给出这两篇文章的链接:

  • https://arxiv.org/abs/1911.09358

(一)五参数检测方法( 基于角度)

在当前常用的旋转检测框的角度定义下,由于存在旋转角度的边界问题,会产生不必要的损失!
在这里插入图片描述

(二)八参数检测方法(point-based)的边界

如果是蓝框是anchor,红框是ground-truth,那么通过点的排序之后,实际和理想的回归方式是一样的(按照回归的距离定义)
在这里插入图片描述

二、方案分析

(一)问题定义

首先我们要了解一下为什么在做四边形检测前要对四个角点进行排序。举一个简单的例子,如果一个四边形的ground-truth是(x1,y1,x2,y2,x3,y3,x4,y4)并且所有的ground-truth并不是按一定规则顺序标注的,那么检测器有可能给出的预测结果是(x2,y2,x3,y3,x4,y4,x1,y1)。其实这两个是框是完全重合的,但是网络训练算损失的时候并不知道,它会按对应位置计算损失,此时的损失值并不为0甚至很大。

(二)方案

基于上述问题:
1. Gliding Vertex的Head设计
Gliding Vertex文章通过改变框的表示方式避免了排序的麻烦。 先检测水平框,这个是没有序列问题的,然后学习水平框四个角点的偏移量来达到四边形检测的目的,其实这里的(偏移量,对应的水平框的点)配对就有排序的意思了。

原文是这样写的:By limiting the offset on the corresponding side of horizontal bounding box, we may facilitate offset learning and also avoid the confusion for sequential label points in directly regressing the four vertices of oriented objects

在这里插入图片描述

Gliding Vertex通过水平框滑动偏移的方式预测旋转框,避免了直接回归无序角点的问题。其head结构包含以下输出分支:

  • 分类分支(Cls Score):预测目标类别。
  • 水平框回归分支:回归水平外接矩形 ( c e n t e r x , c e n t e r y , w , h ) (center_x, center_y, w, h) (centerx,centery,w,h)
  • 偏移比例分支(Alpha):预测四个角点相对于水平框对应顶点的偏移比例 ( α 1 , α 2 , α 3 , α 4 ) (\alpha_1, \alpha_2, \alpha_3, \alpha_4) (α1,α2,α3,α4),通过 s i = α i ⋅ w s_i = \alpha_i \cdot w si=αiw计算实际偏移量。
  • 倾斜因子(Obliquity Factor):定义为旋转框面积与水平框面积的比值 r = ∣ O ∣ ∣ B h ∣ r = \frac{|O|}{|B_h|} r=BhO,用于区分近水平目标( r ≈ 1 r \approx 1 r1时退化为水平框)和倾斜目标。

关键点顺序控制
通过固定水平框的顶点顺序(左上→右上→右下→左下),间接约束偏移量的对应关系,避免了角点排序问题。

(三)Gliding Vertex方案的问题

Gliding Vertex 预测水平框时存在问题,因此提出 obliquity factor的预测值,来控制当前所要预测目标是否可以直接采用(x,y,w,h)。
在这里插入图片描述

参考

https://zhuanlan.zhihu.com/p/108185873

相关文章:

  • 微服务中的 AKF 拆分原则:构建可扩展系统的核心方法论
  • 鸿蒙Flutter实战:25-混合开发详解-5-跳转Flutter页面
  • HarmonyOS学习——UIAbility组件(上)
  • 交换机工作原理解析与网络安全实践
  • 【计算机网络】TCP如何保障传输可靠性_笔记
  • C++:关联容器set容器,multiset容器
  • ss、lsof 命令
  • git:The following paths are ignored by one of your
  • 单片机如何快速实现查看实时数据
  • OpenCV图像平移示例
  • RocketMQ 事务消息详解及生产使用场景
  • CQF预备知识:一、微积分 —— 1.2.2 函数f(x)的类型详解
  • 微服务架构中的 RabbitMQ:异步通信与服务解耦(二)
  • RabbitMQ可靠传输——持久性、发送方确认
  • 比斯特自动化|移动电源全自动点焊机:高效点焊助力移动电源制造
  • 随机链表的复制问题详解与代码实现
  • 高等数学-极限
  • AutoMapper .net Framework 的 Model转换扩展方法
  • 小球弹弹弹
  • 数据库5——审计及触发器
  • 上海建设工程咨询协会/广东seo推广
  • 茶叶网站建设策划书/大连网站优化
  • 织梦网站环境搭建/北京网站seo优化推广
  • 软件开发需要哪些软件/郑州seo优化顾问
  • 徐州 网站建设/免费推广工具
  • 做网站最好的软件是/软文广告是什么意思