UNet改进(26):UNet结合分层注意力机制的图像分割深度解析
一、注意力机制概述
1.1 注意力机制的基本概念
注意力机制源于人类视觉系统的工作方式——我们不会同时处理视野中的所有信息,而是选择性地关注重要区域。在深度学习中,注意力机制通过动态调整特征图中不同区域或通道的重要性,使模型能够聚焦于与任务最相关的信息。
1.2 计算机视觉中的注意力类型
在计算机视觉领域,注意力机制主要分为两大类:
-
通道注意力:关注"什么"特征更重要,通过重新校准通道维度的特征响应来实现。
-
空间注意力:关注"哪里"的特征更重要,通过重新校准空间位置的特征响应来实现。
本文介绍的UNetWithAttention模型同时集成了这两种注意力机制,并在不同层次上应用,形成了分层注意力结构。
二、UNetWithAttention架构详解
2.1 整体架构
UNetWithAttention保持了传统UNet的U型结构,由编码器(下采样路径)、解码器(上采样路径)和跳跃连接组成。其创新之处在于:
-
在每一层双卷积块中引入了通道注意力和空间注意力
-
在上采样过程中加入了特征融合注意力
-
在瓶颈层添加了