卷积神经网络详解
CBAM自注意力机制想象成给神经网络装了个“智能放大镜”:
- 通道注意力:相当于先判断“哪些特征(比如颜色、形状、纹理)是有用的”。比如看动物图片时,先确定“毛发纹理”“体型轮廓”这些通道比“背景颜色”更重要,然后给这些有用的通道“调亮”。
- 空间注意力:接着判断“这些有用的特征在图中哪里”。比如找到“毛发纹理”在动物身体区域,就把这个区域“放大聚焦”,忽略无关的背景。两个步骤结合起来,模型就会像人一样,先抓重点特征,再盯准特征的位置,自然就能更准确地完成任务啦~ 比如识别猫的时候,既关注“猫的毛发纹理”这个关键特征(通道),又聚焦到“猫的身体区域”(空间),识别准确率就上去了。