当前位置: 首页 > news >正文

U-Net图像语义分割中梯度下降的直观解释

1. 图像语义分割的原理

图像语义分割任务的目标是:逐像素分类。也就是说,对输入图像中的每一个像素都预测其所属类别(例如前景/背景或多类别场景)。

  • 输入:一张图片

  • 输出:同尺寸的 mask,每个像素属于某个类别(例如:前景/背景,或者多类分割)。

行人语义分割 任务中:

  • 类别 1:行人(前景)

  • 类别 0:背景

⚠️ 注意:这里讨论的是 语义分割,即对所有像素赋予类别标签;并不区分图像中不同个体的行人实例。

U-Net 采用 编码器-解码器结构

  • 编码器逐步下采样,提取语义特征。

  • 解码器逐步上采样,恢复空间分辨率。

  • 跳跃连接 (skip connection) 把低层细节特征与高层语义特征融合,使输出既有语义信息又保留边缘细节


2. 损失函数:以二分类交叉熵 (BCE) 为例

为了训练模型,需要定义损失函数,衡量预测结果与真实标签的差距。

BCE 损失函数:

  • N:像素总数

  • yi:真实标签(0=背景,1=行人)

  • pi:模型预测的属于行人的概率

例子

假设某个像素真实是行人 (y=1),模型预测概率为 p=0.9。

代入公式:

数值结果:

说明预测很好,损失较小。

如果预测错误,例如 p=0.1:

损失大得多,模型会受到强烈惩罚。


3. 梯度的计算

要优化模型,需要计算损失对参数的梯度。

对预测概率 pi求导:

这就是反馈信号:

  • 如果真实 yi=1,梯度是 −1/pi
    → 当 pi​ (预测错,模型信心不足),梯度大 → 强烈惩罚,推动模型增大 pi。

  • 如果真实 yi=0,梯度是 1/(1−pi)
    → 当 pi (预测错,把负类当正类),梯度大 → 强烈惩罚,推动模型减小 pi。


4. 梯度下降:约束模型

梯度表示损失函数在当前点对参数的变化趋势,它指向损失函数增长最快的方向。要让损失变小,必须沿着 梯度的反方向 更新,也就是减去梯度

参数更新公式:

  • θ:模型参数(卷积核权重等)

  • η:学习率

  • ∇θL:损失函数对参数的梯度

直观理解:

  • 预测正确 → 损失小,梯度小 → 参数更新幅度小。

  • 预测错误 → 损失大,梯度大 → 参数快速调整。

通过反复迭代,模型逐渐学会让行人像素概率接近 1,背景像素概率接近 0,从而完成分割任务。


5. 总结

  • 分割原理逐像素分类,U-Net 编码+解码+跳跃连接。

  • 损失函数:BCE 衡量预测概率与真实标签的差异。

  • 梯度:通过对损失函数求导,得到反馈信号,指示模型参数该往哪个方向更新。

  • 梯度下降:不断沿损失下降方向更新参数,最终让模型学会正确分割图像。

http://www.dtcms.com/a/351428.html

相关文章:

  • 动态规划:为什么暴力算法会有重复子问题
  • 深度学习自动驾驶BEV【专业名词解释汇总】
  • VS中创建Linux项目
  • Tomcat的VM options
  • 我在TSX开发中的实用指南:从基础到实战
  • Java大厂面试实战:从Spring Boot到微服务架构的全链路技术解析
  • swift 开发抠图工具实现思路,与代码详解
  • Java全栈开发面试实录:从基础到实战的深度解析
  • Nginx如何实现反向代理和负载均衡器等功能的
  • 要闻集锦|阿里官网调整为四大业务板块;华为云重组多个事业部涉及上千人;群核科技在港交所更新招股书
  • Swift高阶函数-contains、allSatisfy、reversed、lexicographicallyPrecedes
  • 【大前端】实现一个前端埋点SDK,并封装成NPM包
  • 如何避免频繁切换npm源
  • Redis相关命令详解及其原理
  • AI在提升阅读效率的同时,如何加强理解深度?
  • 嵌入式(day34) http协议
  • 使用Java对接印度股票市场API开发指南
  • Markdown学习笔记(4)
  • 计算神经科学数学建模编程深度前沿方向研究(上)
  • 新手向:pip安装指南
  • 《数据之心》——鱼小妖的觉醒(科研篇)
  • DAY 57 经典时序预测模型1
  • 如何在PC上轻松访问iPhone照片(已解决)
  • UE5 PCG 笔记(三) Normal To Density 节点
  • 神经网络参数量计算详解
  • linux服务器监控平台搭建流程
  • 深度学习:卷积神经网络(CNN)
  • [Mysql数据库] 知识点总结2
  • 高教杯数学建模2021-C 生产企业原材料的订购与运输
  • 将vmware workstation虚拟机迁移至pve