UNet改进(36):融合FSATFusion的医学图像分割
1. 注意力机制的理论基础
1.1 空间注意力机制
空间注意力机制模拟人类视觉系统,能够关注图像中的显著区域。其核心思想是根据特征图的空间位置生成权重图,突出重要区域并抑制无关信息。常见的实现方式是通过沿通道维度的池化操作获取空间统计信息,然后通过卷积层生成空间注意力图。
1.2 频率注意力机制
频率注意力是相对较新的概念,它通过在频率域中分析特征来捕获全局上下文信息。与空间注意力不同,频率注意力利用傅里叶变换将特征映射到频率域,在频域中进行特征选择和信息增强,最后通过逆变换恢复回空间域。
1.3 注意力融合策略
单一类型的注意力机制往往只能捕获特定类型的信息。将空间和频率注意力相结合,可以同时利用空间域的位置敏感性和频率域的全局上下文感知能力,形成互补优势。
2. FS-UNet架构设计与实现
2.1 整体架构概述
我们提出的FS-UNet基于经典U-Net架构,在其跳跃连接和解码器部分融入了频率-空间注意力融合模块(FSATFusion)。该架构保持了U-Net的编码器-解码器结构,但在每个双卷积块后加入了注意力模块,使网络能够自适应地重新校准特征响应。