从AAAI2025中挑选出对目标检测有帮助的文献——第一期
🎯 高相关(强烈建议阅读)
1️⃣ U-KAN: Makes Strong Backbone for Medical Image Segmentation and Generation
页码:4652–4660 | 作者:Chenxin Li et al.
💡 与你最直接相关。
- 提出了一种 U-KAN 网络,将 KAN(Kolmogorov-Arnold Network)理念引入医学图像分割与生成中。
- 强调“构建强大 backbone”以适应复杂医学影像。
- 对你优化 YOLOv12 的 backbone(例如引入函数表示、连续空间建模)非常有参考价值。
🧠 可借鉴思路:将 KAN 模块嵌入 YOLO 的 C3 或 Conv 块中,增强特征表达。
2️⃣ ConDSeg: A General Medical Image Segmentation Framework via Contrast-Driven Feature Enhancement
页码:4571–4579 | 作者:Mengqi Lei et al.
💡 医学图像增强相关,对乳腺影像特征增强尤其有启发。
- 使用 对比度驱动的特征增强模块(Contrast-Driven Feature Enhancement),提升局部结构识别能力。
- 类似于注意力机制,可借鉴于 YOLO 的 backbone 层或 FPN。
🧠 可借鉴思路:将其增强模块替代部分 CSPBlock,用于提升乳腺病灶边缘或纹理区的可分性。
3️⃣ KDAT: Inherent Adversarial Robustness via Knowledge Distillation with Adversarial Tuning for Object Detection Models
页码:4598–4606 | 作者:Yarin Yerushalmi Levi et al.
💡 直接针对目标检测模型。
- 提出一种通过知识蒸馏+对抗性调优提升检测模型鲁棒性的方法。
- 若你的乳腺影像中噪声较多(如模糊、亮度不均),可考虑引入其鲁棒性机制。
🧠 可借鉴思路:在训练 YOLO 时加入蒸馏损失或小扰动增强鲁棒性。
4️⃣ FD2-Net: Frequency-Driven Feature Decomposition Network for Infrared-Visible Object Detection
页码:4797–4805 | 作者:Ke Li et al.
💡 与“特征分解+多频率信息融合”有关。
- 通过频率分解模块提取不同尺度的特征并进行融合,用于多模态目标检测。
- 非常适合借鉴其frequency attention思想,用于乳腺X线影像中不同纹理层次的强化。
🧠 可借鉴思路:在 backbone 中增加 frequency-aware 模块或 FFT attention。
5️⃣ RemDet: Rethinking Efficient Model Design for UAV Object Detection
页码:4643–4651 | 作者:Chen Li et al.
💡 高效检测模型设计,与 YOLOv12 改进直接对应。
- 提出一种轻量化 yet 高效的检测架构,强调特征金字塔与检测头的优化。
- 研究如何在保持精度的前提下降低计算量,非常适合你在乳腺影像任务中复现。
🧠 可借鉴思路:借鉴其轻量 backbone 或高效 FPN 设计,减少 YOLOv12 的冗余计算。
⚙️ 中等相关(可选阅读,启发模块设计)
6️⃣ BSAFusion: A Bidirectional Stepwise Feature Alignment Network for Unaligned Medical Image Fusion
页码:4725–4733 | 作者:Huafeng Li et al.
💡 虽然是图像融合任务,但其“双向逐步特征对齐”思路可启发 YOLO 的多尺度融合模块。
🧠 可借鉴思路:在 PAN/FPN 中实现双向 cross-scale alignment,提高浅层与深层特征一致性。
7️⃣ Prompt-SID: Learning Structural Representation Prompt via Latent Diffusion for Single Image Denoising
页码:4734–4742 | 作者:Huaqiu Li et al.
💡 与注意力增强结构相关。
- 通过 diffusion 机制学习结构提示,可增强 YOLO backbone 的结构敏感性。
🧠 可借鉴思路:为乳腺影像引入结构引导模块,让网络更关注组织边缘。
8️⃣ An Efficient Framework for Enhancing Discriminative Models via Diffusion Techniques
页码:4670–4678 | 作者:Chunxiao Li et al.
💡 强调“判别模型的扩散增强”。
- 虽然不是检测任务,但 diffusion 机制可以借鉴用于特征正则化或鲁棒性提升。
9️⃣ AIF-SFDA: Autonomous Information Filter Driven Source-Free Domain Adaptation for Medical Image Segmentation
页码:4716–4724 | 作者:Haojin Li et al.
💡 对医学图像的域自适应有启发。
- 如果你的乳腺影像来自多个来源(如 DDSM、VinDr、MIAS),可以借鉴其域不变特征提取思想。
🚫 低相关(可略读或跳过)
- 视频生成/多模态(MAMS, Tri-Ergon, MergeNet, Multi-View Pose Estimation 等)
- 图像修复/上色/去噪(Enabling Region-Specific Control, StyO, HomeDiffusion 等)
- 点云、音频、多视图人类姿态等任务(FEAST-Mamba, Multi-View 3D Human Pose Estimation 等)
✅ 推荐阅读顺序
- U-KAN → backbone 结构创新
- ConDSeg → 特征增强与注意力机制
- RemDet → 高效检测结构设计
- FD2-Net → 频域特征融合思路
- KDAT → 检测鲁棒性与蒸馏训练
- (可选)BSAFusion、AIF-SFDA → 多模态/域适应辅助思路