当前位置: 首页 > news >正文

从AAAI2025中挑选出对目标检测有帮助的文献——第六期

🔹 1. SIGraph: Saliency Image-Graph Network for Retinal Disease Classification in Fundus Image

用于眼底图像的显著性图-图网络(显著区域建模 + 图注意机制)
应用价值:

  • 医学图像场景,与乳腺X线片同属灰度结构稀疏数据;
  • 可借鉴“显著性区域 + 图注意机制”思想,强化病灶特征区域;
  • 可将“显著性引导图卷积”嵌入 YOLOv12 的 C3 模块或 Bottleneck 层,替代部分普通卷积。

👉 关键词: Graph Attention, Saliency Prior, Medical Vision


🔹 2. Category Prompt Mamba Network for Nuclei Segmentation and Classification

类别提示 Mamba 网络,用于细胞核分割与分类
应用价值:

  • Mamba 结构是一种状态空间模型(SSM),最近在计算机视觉中取代 Transformer 成为新趋势;
  • 可将 Mamba Block 替代 YOLOv12 的一部分 Transformer-或CSP-like模块,实现长程依赖建模但计算量更低;
  • 特别适合医学图像的小目标检测与低纹理特征建模。

👉 关键词: Mamba Block, Prompt Guidance, Lightweight Backbone


🔹 3. DiMSOD: A Diffusion-Based Framework for Multi-Modal Salient Object Detection

扩散式多模态显著目标检测框架
应用价值:

  • 虽然是扩散模型,但其特征提取部分用到了多阶段特征融合与层次注意机制
  • 可以借鉴其 encoder 部分的 Progressive Attention Aggregation (PAA) 结构,提升多尺度下采样的特征表达。

👉 关键词: Multi-scale Attention, Progressive Fusion, Feature Decoding


🔹 4. Point Cloud Mamba: Point Cloud Learning via State Space Model

点云 Mamba 网络,通过状态空间模型学习点云
应用价值:

  • 论文中的 Mamba Block 改进版(Spatial Mamba)非常适合嵌入 CNN backbone;
  • 可借鉴其“动态状态传播 + 局部上下文感知”机制,用于 YOLOv12 的 Downsample 阶段。

👉 关键词: State Space, Spatial Propagation, Lightweight


🔹 5. Pose Magic: Efficient and Temporally Consistent Human Pose Estimation with a Hybrid Mamba-GCN Network

混合 Mamba-GCN 网络
应用价值:

  • 引入了Mamba + 图卷积混合注意机制
  • 对 YOLOv12 而言,可以在 backbone 中引入 GCN-style 局部拓扑关系建模,强化乳腺肿块边缘区域感知;
  • 尤其适合非结构化特征的检测任务。

👉 关键词: Hybrid Attention, Mamba-GCN, Temporal/Spatial Consistency


🔹 6. Beyond Spatial Domain: Cross-domain Promoted Fourier Convolution Helps Single Image Dehazing

跨域傅里叶卷积
应用价值:

  • 通过频域卷积增强模型的全局感知能力;
  • 可替代 YOLOv12 backbone 中部分标准卷积层,实现更强的跨层语义信息传递。

👉 关键词: Fourier Convolution, Global Context, Lightweight


✅ 推荐组合方案(适合你新任务的 YOLOv12 改进方向):

Backbone:

  • 将 YOLOv12 原 CSP-like 结构替换为 Mamba Block + Cross-Fourier Conv
  • 或采用 Hybrid Mamba-GCN 模块提升语义聚合能力

下采样:

  • 借鉴 “Point Cloud Mamba” 的 Dynamic State Propagation,实现跨层信息保持
  • 或在下采样阶段引入 Fourier Attention Pooling 提升特征平滑性

注意力机制:

  • 参考 “SIGraph” 的 Graph Attention,在检测头前加入 “显著性区域增强模块(SAGM)”
  • 可实现特征显著区域的强化,提高乳腺肿块边缘识别率
http://www.dtcms.com/a/478453.html

相关文章:

  • 【深度学习】反向传播
  • 网站开发交接新闻源发稿平台
  • 滴答时钟延时
  • 【C++篇】:ServiceBus RPC 分布式服务总线框架项目
  • 后训练——Post-training技术介绍
  • 获取KeyStore的sha256
  • Linux (5)| 入门进阶:Linux 权限管理的基础规则与实践
  • 常见压缩包格式详解:区别及在不同系统中的解压方式
  • 【数学 进制 数位DP】P9362 [ICPC 2022 Xi‘an R] Find Maximum|普及+
  • .net过滤器和缓存
  • 张家港网站建设培训班电力建设专家答疑在哪个网站
  • 零基础学AI大模型之大模型的“幻觉”
  • 网站快速优化排名排名c语言入门自学零基础
  • MySQL排序规则utf8mb4_0900_ai_ci解析
  • 做网站别名解析的目的是什么同城广告发布平台
  • GPT4Free每日更新的免登录工作AI提供商和模型列表
  • 网站群建设座谈会云浮新增病例详情
  • Proxmox 9 一键更新虚拟机mac
  • C# WPF DataGrid使用Observable<Observable<object>类型作为数据源
  • sem网站建设网站是由多个网页组成的吗
  • redis中的数据类型和适用场景
  • 从字节到网页:HTTP 与 TCP 的底层密码全解析
  • 建设局招标办网站百度seo搜索引擎优化厂家
  • 隧道高清晰广播+紧急电话系统的应用
  • Ubuntu使用图片
  • C# 求圆柱体的周长(Find the perimeter of a cylinder)
  • php 网站部署点击网站出现微信二维码的链接怎么做
  • MCU和GPIO (1)
  • STM32H743-ARM例程18-SPI
  • 力扣Hot100--94.二叉树的中序遍历