当前位置: 首页 > news >正文

深度学习loss总结(二)

       对于目前深度学习主流任务学习,loss的设置至关重要。下面就不同任务的loss设置进行如下总结:

(1)目标检测

2D/3D目标检测中的 Loss(损失函数)是训练模型时优化目标的核心,通常包括位置、类别、尺寸、方向等多个方面。以下是目前 常见的 2D 和 3D 目标检测 Loss 分类与总结


🔷 一、2D 目标检测常见 Loss

2D 目标检测常见于图像(如 COCO、VOC),其 Loss 主要分为以下三类:

1. 分类损失(Classification Loss)
  • Cross Entropy Loss:最常用,如 Faster R-CNN、YOLOv3。

  • Focal Loss:用于处理前景/背景不均衡,如 RetinaNet。

2. 边界框回归损失(Bounding Box Regression Loss)
  • Smooth L1 Loss / Huber Loss:常用于 R-CNN 系列。

  • IoU Loss:直接优化 IoU,稳定性更好。

  • GIoU / DIoU / CIoU Loss(用于 YOLOv4/v5 等):

    • GIoU: Generalized IoU,考虑重叠与包围。

    • DIoU: Distance IoU,考虑中心距离。

    • CIoU: Complete IoU,综合中心、面积和长宽比。

3. 辅助任务损失
  • Objectness Loss:YOLO 系列判断该区域是否有目标。

  • Center-ness Loss:FCOS 中判断中心点可信度。

  • Heatmap Loss(如 CornerNet, CenterNet):

    • 用高斯热图回归目标中心点,常用 MSE 或 focal loss


🔷 二、3D 目标检测常见 Loss

3D 检测用于点云(如 KITTI、nuScenes、Waymo),损失函数更加复杂,涵盖了空间维度、方向等:

1. 分类损失
  • 同 2D 检测,使用 CrossEntropy/Focal Loss。

  • 在 anchor-based 方法中用于前背景分类。

2. 3D 边界框回归损失
  • 通常为多项组合,包括中心位置、大小、方向等:

➤ 位置损失:
  • L1 / Smooth L1:对中心点 (x,y,z)(x, y, z)。

  • Center Distance Loss:点云中心与GT中心的距离。

➤ 尺寸损失:
  • 对 w,h,lw, h, l 使用 L1/Smooth L1。

➤ 朝向损失(方向角):
  • 角度回归 loss:L1 / Smooth L1。

  • 角度分类 loss:方向离散为多个 bin,使用分类损失。

  • Sin-Cos 回归 loss:使用 sin⁡(θ),cos⁡(θ)\sin(\theta), \cos(\theta) 规避周期性问题。

3. IoU类损失
  • 3D IoU Loss(较难优化但直观):如 PointRCNN。

  • BEV IoU Loss(Bird's Eye View):简化空间问题。

4. 关键点 / 热力图损失
  • Heatmap Loss(如 CenterPoint, PV-RCNN)用于预测中心点。

    • 通常为 Gaussian Focal Loss

  • Offset Loss:预测热图中心点到真实中心点的偏移量。

5. 方向不变性损失
  • Corner Loss(如 Frustum-PointNet):

    • 通过角点预测反推旋转和平移,更鲁棒。

  • Chamfer Distance(点云匹配):在 PointNet++ 等方法中。


🔷 三、检测 Loss 组合示意

模型 分类 Loss 回归 Loss 特殊项
Faster R-CNN Cross Entropy Smooth L1 -
YOLOv5 BCE / Focal CIoU Loss Objectness Loss
RetinaNet Focal Loss Smooth L1 -
CenterNet Heatmap Loss Offset + Size (L1) -
PointRCNN Focal + IoU 3D Box Regression + Corner Loss Direction Class
PV-RCNN Heatmap + CE L1 + 3D IoU + Sin-Cos Angle Loss RoI Pool + BEV Match
CenterPoint Heatmap + CE Offset + Size + Direction (multi-part) Gaussian Focal + Direction Bin

✅ 总结:选择检测 Loss 的核心要点

目标 推荐 Loss 类型
二分类 / 多分类
http://www.dtcms.com/a/311439.html

相关文章:

  • [硬件电路-116]:模拟电路 - 信号处理电路 - 程控增益放大器
  • Batch Normalization(BN):深度学习中的“训练加速器”与实践指南
  • LLM Prompt与开源模型资源(3)如何写一个好的 Prompt
  • 【转】大模型安全治理的现状与展望
  • 【REACT18.x】使用vite创建的项目无法启动,报错TypeError: crypto.hash is not a function解决方法
  • SpringCloud实战:机器人对战系统架构
  • 【LeetCode 热题 100】739. 每日温度——(解法一)单调栈+从右到左
  • STL 算法与迭代器终极指南:从基础到高级应用
  • 函数指针——回调函数
  • 文件同步神器-rsync命令讲解
  • ESP32- 项目应用1 智能手表之功能补全 #5
  • UDP通信中BIND端口号的作用解析,LOCALPORT的关系解析
  • 代码随想录刷题Day23
  • verilog的学习
  • 高效游戏状态管理:使用双模式位运算与数学运算
  • 从基础功能到自主决策, Agent 开发进阶路怎么走?
  • 技巧|SwanLab记录ROC曲线攻略
  • VueX进阶Pinia
  • go idea goland debug 报错 no debug info found
  • 从递归到动态规划-解码方法
  • Json Jsoncpp
  • 深入 Go 底层原理(十四):timer 的实现与高性能定时器
  • python JSONPath 表达式生成器
  • 淘宝获取商品SKU详情API接口操作指南
  • 交互 Codeforces Round 1040 Interactive RBS
  • 开发指南128-基础类-BaseDAO
  • 力扣面试150题--回文数
  • ABP VNext + NATS JetStream:高性能事件流处理
  • FPGA kernel 仿真器调试环境搭建
  • 分类任务当中常见指标 F1分数、recall、准确率分别是什么含义