当前位置：首页 > news >正文

python打卡 DAY 46 通道注意力(SE注意力)

news 来源：原创 2025/6/30 16:27:58

一、CNN特征图通道特性

1. 不同卷积层的特征图可视化

2. 特征图可视化代码

二、注意力机制概述

1. 注意力机制分类

三、SE(Squeeze-and-Excitation) Block详解

1. 标准SE模块结构

2. PyTorch实现

3. 插入位置建议

四、注意力特征图分析

1. 注意力热力图可视化

2. 注意力前后特征对比

五、SE注意力效果验证

1. CIFAR10分类对比实验

2. 计算开销分析

六、扩展应用与变体

1. SE变体比较

2. 通道注意力的通用插入方法

关键问题解答

1. SE模块为什么有效？

2. 如何选择reduction ratio？

3. 注意力权重异常排查

一、CNN特征图通道特性

1. 不同卷积层的特征图可视化

特征图观察：

浅层通道：响应简单模式（边缘、颜色、纹理）
深层通道：对应高级语义（物体部件、整体形状）

2. 特征图可视化代码

import torch
import matplotlib.pyplot as pltdef visualize_channels(feature_maps, n_channels=8):"""可视化前n个通道的特征图"""plt.figure(figsize=(12, 6))for i in range(n_channels):plt.subplot(2, 4, i+1)plt.imshow(feature_maps[0, i].detach().cpu(), cmap='viridis')plt.title(f'Channel {i}')plt.axis('off')plt.tight_layout()plt.show()
# 获取某卷积层输出
with torch.no_grad():features = model.conv1(input_tensor)  # 假设model已定义visualize_channels(features)

二、注意力机制概述

1. 注意力机制分类

核心思想：让网络学会"关注"重要特征，抑制无关信息

三、SE(Squeeze-and-Excitation) Block详解

1. 标准SE模块结构

2. PyTorch实现

class SEBlock(nn.Module):def __init__(self, channels, reduction=16):super().__init__()self.avg_pool = nn.AdaptiveAvgPool2d(1)self.fc = nn.Sequential(nn.Linear(channels, channels // reduction),nn.ReLU(inplace=True),nn.Linear(channels // reduction, channels),nn.Sigmoid())def forward(self, x):b, c, _, _ = x.size()# Squzey = self.avg_pool(x).view(b, c)# Excitationy = self.fc(y).view(b, c, 1, 1)# Scalereturn x * y.expand_as(x)

3. 插入位置建议

网络部位	插入方式	效果
残差块内	在shortcut前	提升最明显
卷积层后	ReLU激活前	适度提升
网络尾部	分类器前	轻微提升

ResNet中的典型插入：

class SEBottleneck(nn.Module):expansion = 4def __init__(self, inplanes, planes, stride=1, downsample=None, reduction=16):super().__init__()# 原有Bottleneck结构self.conv1 = nn.Conv2d(inplanes, planes, kernel_size=1, bias=False)self.bn1 = nn.BatchNorm2d(planes)self.conv2 = nn.Conv2d(planes, planes, kernel_size=3, stride=stride,padding=1, bias=False)self.bn2 = nn.BatchNorm2d(planes)self.conv3 = nn.Conv2d(planes, planes * 4, kernel_size=1, bias=False)self.bn3 = nn.BatchNorm2d(planes * 4)self.relu = nn.ReLU(inplace=True)self.downsample = downsampleself.stride = stride# 添加SE模块self.se = SEBlock(planes * 4, reduction)def forward(self, x):residual = xout = self.conv1(x)out = self.bn1(out)out = self.relu(out)out = self.conv2(out)out = self.bn2(out)out = self.relu(out)out = self.conv3(out)out = self.bn3(out)# SE操作out = self.se(out)if self.downsample is not None:residual = self.downsample(x)out += residualout = self.relu(out)return out

四、注意力特征图分析

1. 注意力热力图可视化

def visualize_se_heatmap(model, input_tensor, layer_name='se'):# 注册hook获取注意力权重activations = {}def get_activation(name):def hook(model, input, output):if name == layer_name:activations[name] = output.detach()return hook# 假设model.se是SE模块handle = model.se.register_forward_hook(get_activation('se'))# 前向传播with torch.no_grad():_ = model(input_tensor.unsqueeze(0))# 可视化weights = activations['se'].squeeze()plt.figure(figsize=(10, 2))plt.bar(range(len(weights)), weights.numpy())plt.title('Channel Attention Weights')plt.xlabel('Channel Index')plt.ylabel('Weight')handle.remove()

2. 注意力前后特征对比

def compare_features(model, input_tensor):# 获取原始特征original = model.conv_layers(input_tensor)# 获取SE后的特征se_features = model.se_block(original)# 可视化对比plt.figure(figsize=(12, 6))plt.subplot(1, 2, 1)plt.title('Original Features')plt.imshow(original[0, 0].detach().cpu(), cmap='viridis')plt.subplot(1, 2, 2)plt.title('SE Weighted Features')plt.imshow(se_features[0, 0].detach().cpu(), cmap='viridis')plt.show()

五、SE注意力效果验证

1. CIFAR10分类对比实验

模型	参数量	准确率	相对提升
ResNet-18	11.2M	93.5%	-
ResNet-18 + SE	11.3M	94.7%	+1.2%
ResNet-50	23.5M	95.1%	-
ResNet-50 + SE	23.7M	96.3%	+1.2%

2. 计算开销分析

# SE模块计算量估算
def se_complexity(C, H, W, reduction=16):pool_ops = H * W * Cfc1_ops = C * (C // reduction)fc2_ops = (C // reduction) * Creturn pool_ops + fc1_ops + fc2_ops# 示例：256通道的14x14特征图
print(f"SE计算量: {se_complexity(256, 14, 14):,}次操作")

六、扩展应用与变体

1. SE变体比较

变体名称	核心改进	适用场景
ECANet	1D卷积替代FC	轻量化网络
SKNet	动态卷积核选择	多尺度特征
CBAM	结合空间注意力	需要空间信息

2. 通道注意力的通用插入方法

def add_se_to_model(model, reduction=16):"""遍历模型添加SE模块"""for name, module in model.named_children():if isinstance(module, nn.Conv2d):# 在卷积层后添加SEnew_seq = nn.Sequential(module,SEBlock(module.out_channels, reduction))setattr(model, name, new_seq)else:# 递归处理子模块add_se_to_model(module, reduction)

关键问题解答

1. SE模块为什么有效？

特征校准：通过全局信息重新校准通道重要性
动态调整：根据输入内容动态调整特征响应
轻量高效：增加少量参数带来明显提升

2. 如何选择reduction ratio？

常用值：8-32之间
权衡标准：
- 大ratio（如32）→ 参数少但可能欠拟合
- 小ratio（如4）→ 参数多可能过拟合

3. 注意力权重异常排查

现象	可能原因	解决方案
权重趋近1	Sigmoid饱和	添加LayerNorm
权重全零	梯度消失	减小初始学习率
权重随机	训练不足	延长训练周期

@浙大疏锦行

AVL树的简洁写法

Linux中ssh无法使用配置的环境变量，ssh（非登录环境）环境变量和登录环境变量不同步问题

《伴时匣》app开发技术分享--用户登录（3）

7类茶叶嫩芽图像分类数据集

NLP随机插入

（24）如何在 Qt 里创建 c++ 类，以前已经学习过如何在 Qt 里引入资源图片文件。以及如何为继承于 Qt已有类的自定义类重新实现虚函数

JS中判断数据类型的方法

Requests源码分析：面试考察角度梳理

Tomcat性能调优指南

【系统分析师】2021年真题：案例分析-答案及详解

langChain与langGraph的关系与区别

Trie(字典树)

swift-22-面向协议编程、响应式编程

PH热榜 | 2025-06-29

MySQL的调控按钮

stm32之测量周期

JVM中的垃圾收集（GC）

idea运行到远程机器和 idea远程JVM调试

【C++】C++中的友元函数和友元类

【科技核心期刊推荐】《计算机与现代化》

一、CNN特征图通道特性

1. 不同卷积层的特征图可视化

2. 特征图可视化代码

二、注意力机制概述

1. 注意力机制分类

三、SE(Squeeze-and-Excitation) Block详解

1. 标准SE模块结构

2. PyTorch实现

3. 插入位置建议

四、注意力特征图分析

1. 注意力热力图可视化

2. 注意力前后特征对比

五、SE注意力效果验证

1. CIFAR10分类对比实验

2. 计算开销分析

六、扩展应用与变体

1. SE变体比较

2. 通道注意力的通用插入方法

关键问题解答

1. SE模块为什么有效？

2. 如何选择reduction ratio？

3. 注意力权重异常排查

相关文章：