从AAAI2025中挑选出对目标检测有帮助的文献——第六期
🔹 1. SIGraph: Saliency Image-Graph Network for Retinal Disease Classification in Fundus Image
用于眼底图像的显著性图-图网络(显著区域建模 + 图注意机制)
应用价值:
- 医学图像场景,与乳腺X线片同属灰度结构稀疏数据;
- 可借鉴“显著性区域 + 图注意机制”思想,强化病灶特征区域;
- 可将“显著性引导图卷积”嵌入 YOLOv12 的 C3 模块或 Bottleneck 层,替代部分普通卷积。
👉 关键词: Graph Attention, Saliency Prior, Medical Vision
🔹 2. Category Prompt Mamba Network for Nuclei Segmentation and Classification
类别提示 Mamba 网络,用于细胞核分割与分类
应用价值:
- Mamba 结构是一种状态空间模型(SSM),最近在计算机视觉中取代 Transformer 成为新趋势;
- 可将 Mamba Block 替代 YOLOv12 的一部分 Transformer-或CSP-like模块,实现长程依赖建模但计算量更低;
- 特别适合医学图像的小目标检测与低纹理特征建模。
👉 关键词: Mamba Block, Prompt Guidance, Lightweight Backbone
🔹 3. DiMSOD: A Diffusion-Based Framework for Multi-Modal Salient Object Detection
扩散式多模态显著目标检测框架
应用价值:
- 虽然是扩散模型,但其特征提取部分用到了多阶段特征融合与层次注意机制;
- 可以借鉴其 encoder 部分的 Progressive Attention Aggregation (PAA) 结构,提升多尺度下采样的特征表达。
👉 关键词: Multi-scale Attention, Progressive Fusion, Feature Decoding
🔹 4. Point Cloud Mamba: Point Cloud Learning via State Space Model
点云 Mamba 网络,通过状态空间模型学习点云
应用价值:
- 论文中的 Mamba Block 改进版(Spatial Mamba)非常适合嵌入 CNN backbone;
- 可借鉴其“动态状态传播 + 局部上下文感知”机制,用于 YOLOv12 的 Downsample 阶段。
👉 关键词: State Space, Spatial Propagation, Lightweight
🔹 5. Pose Magic: Efficient and Temporally Consistent Human Pose Estimation with a Hybrid Mamba-GCN Network
混合 Mamba-GCN 网络
应用价值:
- 引入了Mamba + 图卷积混合注意机制;
- 对 YOLOv12 而言,可以在 backbone 中引入 GCN-style 局部拓扑关系建模,强化乳腺肿块边缘区域感知;
- 尤其适合非结构化特征的检测任务。
👉 关键词: Hybrid Attention, Mamba-GCN, Temporal/Spatial Consistency
🔹 6. Beyond Spatial Domain: Cross-domain Promoted Fourier Convolution Helps Single Image Dehazing
跨域傅里叶卷积
应用价值:
- 通过频域卷积增强模型的全局感知能力;
- 可替代 YOLOv12 backbone 中部分标准卷积层,实现更强的跨层语义信息传递。
👉 关键词: Fourier Convolution, Global Context, Lightweight
✅ 推荐组合方案(适合你新任务的 YOLOv12 改进方向):
Backbone:
- 将 YOLOv12 原 CSP-like 结构替换为 Mamba Block + Cross-Fourier Conv
- 或采用 Hybrid Mamba-GCN 模块提升语义聚合能力
下采样:
- 借鉴 “Point Cloud Mamba” 的 Dynamic State Propagation,实现跨层信息保持
- 或在下采样阶段引入 Fourier Attention Pooling 提升特征平滑性
注意力机制:
- 参考 “SIGraph” 的 Graph Attention,在检测头前加入 “显著性区域增强模块(SAGM)”
- 可实现特征显著区域的强化,提高乳腺肿块边缘识别率