当前位置: 首页 > news >正文

【2025ICCV-目标检测方向】WaveMamba:用于 RGB-红外目标检测的小波驱动曼巴融合

1. 背景与动机

RGB和红外图像在目标检测中具有互补特性:RGB图像在光照充足时提供丰富的纹理细节(高频特征),但在低光或恶劣天气下表现不佳;红外图像则依赖热辐射信息,在低光条件下鲁棒性强,但细节较少(低频主导)。现有融合方法(如CNN或Transformer-based)存在局限性:CNN难以捕获长距离依赖,Transformer计算复杂度高,且均未充分利用频率域的互补性。

 

如图1所示,通过离散小波变换(DWT)分析M3FD数据集,发现IR图像在低频子带(如LL)信息熵更高(富含结构信息),而RGB图像在高频子带(如LH、HL、HH)信息熵更高(富含边缘细节)。这验证了频域互补性,为设计高效融合方法提供了依据。


2. 方法细节

WaveMamba的整体架构包括三部分:双流特征提取骨干(集成DWT)、多级WaveMamba Fusion Blocks(WMFB)、改进的YOLOv8检测头(集成逆DWT, IDWT)。核心创新是WMFB,它针对低频和高频特征设计不同融合策略。

2.1 整体架构

 

http://www.dtcms.com/a/312918.html

相关文章:

  • 《金字塔原理》读书思考笔记
  • GitOps:云原生时代的革命性基础设施管理范式
  • 关于 xrdp远程桌面报错“Error connecting to sesman on 127.0.0.1:3350“的解决方法
  • Python 基础语法(一):从常量到运算符
  • LeetCode 126:单词接龙 II
  • C语言的基本结构
  • http://localhost:8080/photos/xxx.png的本地图片访问方案
  • 电路原理图绘制专业实战教程2
  • 0803 思维导图+小项目
  • 【Redis学习路|第一篇】初步认识Redis
  • PPT写作五个境界--仅供学习交流使用
  • 构建企业级Web应用:AWS全栈架构深度解析
  • 力扣经典算法篇-39-有效的数独(二维数组和三维数组的应用)
  • AI 编程技巧、技术笔记
  • 安卓调javaScript Not find method “forceLogout“ implementatidsignature or namesp
  • 面向智能体的上下文工程:策略、实现与 LangGraph 实践
  • 基于单片机火灾报警系统/防火防盗系统设计
  • (9)NMPC非线性模型预测控制及机械臂ROS控制器实现
  • MCP-与本地大模型集成实现工具调用
  • 微服务的使用
  • java中Optional类的使用和注意采坑
  • DBMS设计 之2 从数据中台到三种中台
  • 常见的框架漏洞(Thinkphp,spring,Shiro)
  • 常见的框架漏洞
  • IO流-对象流
  • MCP革命:AI世界的“USB-C”接口如何重塑智能体与外部工具的连接
  • 均线:从市场脉搏到量子计算的时空密码
  • K8S几种常见CNI深入比较
  • Qt::AA_DontCreateNativeWidgetSiblings使用注意事项
  • 游戏设计原理