当前位置：首页 > news >正文

YOLOv2 正负样本分配机制详解

news 2025/7/4 7:56:02

YOLOv2 正负样本分配机制详解

在目标检测任务中，正负样本的定义决定了哪些预测框用于训练，以及如何计算损失函数。YOLOv2 在 YOLOv1 的基础上，引入了 Anchor Boxes（锚框） 机制，正负样本的判断方式也发生了重要变化。

✅ 一、YOLOv2 中的 Anchor Box 引入

YOLOv2 将图像划分为 $\times S$ 网格，每个网格预测 $B$ 个 Anchor Box（默认 5 个），每个 Anchor 预测：

位置偏移 $t_x, t_y, t_w, t_h)$
置信度（objectness score）
多个类别的概率（softmax 或 sigmoid）

🎯 二、正负样本的定义

1. 正样本（Positive Samples）

满足以下条件的预测框被视为正样本：

某个 Ground Truth Box 被分配给 与其 IOU 最大的 Anchor Box。
分配发生在该目标中心点所在的网格 cell 内。
每个 Ground Truth 只分配给 一个 Anchor（最佳匹配）。

即：一张图中有多个目标，每个目标仅分配给一个最合适的 Anchor。

2. 负样本（Negative Samples）

没有被任何 GT 分配的 Anchor 预测框。
与所有 Ground Truth 的最大 IOU 低于阈值（通常为 0.5）。

这些 Anchor 被作为负样本，仅用于训练置信度（objectness）为 0。

🧮 三、样本分配机制图示

Grid Cell (7x7)└─ 每个 Cell 预测 5 个 Anchor Box├─ 与某个 GT IOU 最大 → 正样本├─ IOU 太低 → 负样本└─ 其他 Anchor 忽略

四、与 YOLOv1 的区别

项目	YOLOv1	YOLOv2
Anchor	❌ 无	✅ 有
每个 GT 分配框数量	多个（B 个）	仅一个（最佳 Anchor）
负样本定义	其余所有预测框	未分配且 IOU < 阈值
正样本位置	GT 中心落入的 Cell	同上

五、📌 总结

YOLOv2 中的正负样本策略，主要围绕 Anchor Box 与 Ground Truth 的匹配关系：
• 正样本：与 GT 匹配 IOU 最大的 Anchor
• 负样本：其余 Anchor 且 IOU 低
• 忽略：其他 IOU 不高不低者（可选处理）

Bounding Box 与 Anchor 的关系详解

在目标检测中，Anchor Box 是模型预设的一组参考框模板，而 Bounding Box 是模型预测的最终目标框，两者之间的关系如下：

名称	说明
Anchor Box	预定义的固定尺寸框，用于覆盖不同尺寸、宽高比的目标
Bounding Box	模型输出的框，用于拟合真实物体（Ground Truth Box）的位置

🔁 关系说明

模型以 Anchor 为起点，通过预测 偏移量（offset） 对其进行微调；
每个 Anchor 会输出一个预测框（Bounding Box）；
训练过程中，选出与 Ground Truth 重合度最高（IoU 最大）的 Anchor，作为正样本；
最终的 Bounding Box 是：
$B_{\text{pred}} = \text{Anchor} + \text{偏移量}$

🧠 举例

Anchor: [w=100, h=200]（模型预定义的框）
偏移预测: [dx, dy, dw, dh]
最终预测框 (Bounding Box): 根据 anchor + 偏移解码得到

Anchor 是起点，Bounding Box 是终点。

http://www.dtcms.com/a/265598.html

相关文章：

ollama bge-m3 Embending模型永久加载 does not support generate

Spring注解之@Repository

采样点不一致：总线通信的隐形杀手

C++之红黑树认识与实现

Go应用容器化完全指南：构建最小化安全镜像的终极实践

Jenkins的最佳替代方案TeamCity：优势、差异对比及常见问题解答

使用 HiveMQ Broker 写入 TDengine

C#,VB.NET从JSON数据里提取数组中的对象节点值

【论】电力-交通融合网协同优化：迎接电动汽车时代的挑战

.NET 8.0 Redis 教程

Pytorch中expand()和repeat()函数使用详解和实战示例

github在线图床

一篇文章掌握Docker

Redis 持久化详解、使用及注意事项

关于使用cursor tunnel链接vscode(避免1006 issue的做法)

ASP 安装使用教程

ubuntu rules 使用规则

什么是VR全景展示？VR展示需要哪些科技？

【React Native原生项目不能运行npx react-native run-android项目】

学习设计模式《十六》——策略模式

安装 Docker Compose！！！

蒙特卡洛方法：随机抽样的艺术与科学

SSL Pinning破解实战：企业级移动应用安全测试方案

java集合详解

论文阅读笔记——Autoregressive Image Generation without Vector Quantization

当材料研发遇上「数字集装箱」：Docker如何让科研效率「开挂」？

【unity游戏开发——优化篇】使用Occlusion Culling遮挡剔除，只渲染相机视野内的游戏物体提升游戏性能

AES密码算法的C语言实现（带测试）

经典灰狼算法+编码器+双向长短期记忆神经网络，GWO-Transformer-BiLSTM多变量回归预测，作者：机器学习之心！

【TTS】2024-2025年主流开源TTS模型的综合对比分析