当前位置: 首页 > news >正文

【Arxiv 2025】重磅发布!全新傅里叶残差通道注意力模块FRCA,助显著性目标检测与跨模态融合,精准提升深度学习性能!

Bilibili:CV缝合救星

🌈 小伙伴们看过来~

写推文真的不容易,每一行字、每一张图都倾注了我们的心血💦 如果你觉得这篇内容对你有帮助、有启发,别忘了顺手点个赞、转发一下、或者点个“在看” 支持我们一下哈~✨

你的一点鼓励🌟,对我们来说就是超大的动力!

👀 小声提醒:用电脑打开阅读更舒服哟,排版清晰、体验更棒!谢谢大家~我们会继续努力产出优质内容,陪你一起进步呀✌️❤️

image.png

01 论文信息

论文题目:Deep Fourier-embedded Network for RGB and Thermal Salient Object Detection (Arxiv 2025 预发行论文)

中文题目:基于深度傅里叶嵌入网络的RGB和热成像显著性目标检测

即插即用模块:傅里叶残差通道注意力模块 Fourier Residual Channel Attention Block (简称 FRCA)

02 论文概要

Highlight

image.png

图 1. RGB和热成像图像的幅度、相位、高频和低频分量的可视化。

03 研究背景

   🌧️ 存在的问题(背景动因)

Transformer模型计算复杂度高:现有的Transformer-based模型在处理双模态特征融合时,存在计算开销大和内存消耗高的问题,尤其是在高分辨率图像输入下,Transformer的二次复杂度使其难以高效应用于大规模图像处理任务。
频率差距导致的精度损失:尽管现有深度学习模型在RGB和热成像图像的显著性检测中取得了不错的成绩,但其预测结果与实际值之间仍然存在频率差距,尤其是在边缘和高频信息的捕捉上,导致了精度的下降。
传统卷积方法的不足:传统卷积操作在处理RGB和热成像图像时,无法有效地融合两种模式的信息,尤其在双模态图像的显著性目标检测任务中,卷积无法充分利用RGB与热成像图像之间的互补特性,从而限制了性能的提升。

    💡 解决思路(FRCAB 核心贡献)

傅里叶残差通道注意力模块(FRCAB):提出了基于傅里叶变换的残差通道注意力模块,旨在解决双模态图像中高频信息的捕捉问题。通过在解码器中引入傅里叶变换与残差通道注意力机制,FRCAB可以优先处理高频信息,有效提升了模型在显著性目标检测中的精度和效率。
频率信息优化:通过引入傅里叶变换,FRCAB将低频信息与高频信息进行了有效的分离和优化,解决了传统卷积方法无法有效捕捉细节信息的问题,尤其是在图像边缘和复杂纹理的处理上,进一步提升了模型的表现。
通道注意力机制:FRCAB通过通道注意力机制,对每个通道之间的全局依赖关系进行建模,优化了通道特征的选择与加权,从而提高了模型的判别能力,使其能够在双模态图像的显著性目标检测中获得更好的性能。
高效显著性目标检测:FRCAB结合傅里叶变换和残差通道注意力机制,不仅有效提高了特征提取的精度,而且在保证计算效率的同时,成功解决了频率差距问题,推动了显著性目标检测任务的高效性与高精度表现。

04 模块原理解读

📌 模块解析 | FRCAB 傅里叶残差通道注意力模块

image.png

    图 2. 所提出的FRCAB模块流程图  

    📌 FRCAB 模块聚焦于“高频信息优化”与“全局特征建模”的统一,其核心由以下三个关键特点构成:

傅里叶变换与通道注意力机制结合:通过引入傅里叶变换对低频与高频信息进行分离,结合通道注意力机制,优先学习高频信息,解决了传统卷积无法有效捕捉细节信息的问题。

提升计算效率与内存优化:FRCAB 的设计有效地减少了计算开销与内存消耗,尤其是在处理双模态图像时,通过频率分离与通道加权,提高了计算效率,适合高分辨率图像处理。

全局依赖建模与特征精细化:FRCAB 通过通道间的全局关系建模,有效整合双模态图像的互补信息,并确保在解码阶段高频信息得到优先学习,提升了显著性目标检测的精度和效率。

    🔍 该模块通过“傅里叶变换 + 通道注意力机制 + 全局特征建模”的设计,不仅优化了高频信息的处理,提升了特征提取的精度,还在显著性目标检测任务中展现出优于现有方法的性能,成为提升模型效率与精度的关键组件。

05 创新思路

CV缝合救星原创模块

     🧠 模块名称FG-RCA —— Fourier-Gated Residual Channel Attention(傅里叶门控残差通道注意力模块)

    💡 长按识别🔍,领取💾源码

image.png

💡 设计动机:传统的卷积方法在显著性目标检测任务中存在以下问题:
计算与存储开销过大:传统卷积在处理双模态图像时,计算量大且内存消耗高,尤其是在高分辨率图像中,难以满足轻量化需求。
高频信息难以提取:尽管传统卷积在低频特征提取上有较好表现,但对于高频信息(如边缘细节)往往忽视,导致图像细节丢失,影响检测精度。
频域信息融合不充分:现有方法在频域信息的处理上存在一定局限,无法有效融合振幅和相位信息,导致特征表达不全面。

  FG-RCA 通过 傅里叶变换 + 通道注意力 + 残差融合,有效解决了传统卷积计算量大、高频信息提取不足以及频域信息融合不充分的问题,增强了模型在显著性目标检测任务中的表达力与效率。

📌 核心创新点

1. 傅里叶变换与通道注意力结合(创新点⭐)
通过引入傅里叶变换对振幅和相位进行分离与调制,再结合通道注意力机制,增强了高频信息的学习能力,使得模型能够更好地捕捉图像细节。

2. 高频信息增强(创新点⭐)
在频域中对振幅和相位进行非线性调制,提升了高频成分的关注度,从而改善了细节信息的表达,尤其适用于复杂的目标检测任务。

3. 通道描述向量与2D FFT结合(创新点⭐)
利用通道描述向量和2D FFT,将每个通道的全局信息映射到频域,通过频域重建和逆傅里叶变换,提升了全局上下文建模能力,确保了信息的充分融合。

4. 残差与频域融合(创新点⭐)
通过将频域信息与残差信息结合,进一步提高了网络的稳定性,改善了深层网络的训练效果,并有效避免了信息丢失。

📌 输入输出

  • 输入
    x ∈ [B, C, H, W] (输入特征图)

  • 输出
    [B, C, H, W] (空间尺寸保持不变,增强高频信息表达与全局建模能力)

    📌 过程步骤
Step 1:通道描述向量
通过全局平均池化(GAP)提取输入图像的通道描述向量,进行频域处理。

Step 2:傅里叶变换与频谱分离
将通道描述向量转换为2D网格,进行傅里叶变换,提取振幅和相位信息。

Step 3:振幅与相位调制
对振幅和相位进行非线性调制,调整各频率分量的权重,增强高频特征表达。

Step 4:频域重建与逆傅里叶变换
将调制后的频谱进行逆傅里叶变换,得到增强后的频域信息,恢复到空间域。

Step 5:通道注意力与残差融合
利用通道注意力机制为每个通道分配权重,进行频域与空间域的残差融合。

    👉 总结
FG-RCA 通过 傅里叶变换 + 通道注意力 + 残差融合 的设计,突破了传统卷积在计算量大和高频信息提取不足的问题,在提高效率的同时,增强了高频信息的表达和全局上下文建模能力,特别适用于资源受限的视觉任务,具有优异的显著性目标检测性能。

06 模块适用任务

🎯 FRCA 模块适用任务(Fourier Residual Channel Attention,傅里叶残差通道注意力)

1. 高频信息增强任务:通过傅里叶变换和频谱调制,增强图像的高频信息,适用于显著性目标检测、图像分割等任务,尤其是复杂场景下的精细目标检测。

2. 双模态图像处理任务:结合RGB和热成像图像的互补信息,利用傅里叶变换有效融合两种模态的特征,适合跨模态目标识别与融合任务。

3. 复杂纹理恢复任务:通过频域特征调制与融合,有效提高图像中的细节表达能力,适合医学影像、卫星图像等高细节恢复任务。

4. 深度网络增强任务:作为深度网络的特征增强模块,可提升CNN或Transformer骨干在复杂任务中的表达力和性能,特别适合大规模图像识别与分析。

🎯 FG-RCA 模块适用任务(Fourier-Gated Residual Channel Attention,傅里叶门控残差通道注意力)

1. 显著性目标检测任务:通过傅里叶门控机制与频域调制,增强对细节与高频信息的关注,适用于复杂场景中的目标检测任务。

2. 双模态特征融合任务:针对RGB与热成像图像的多模态融合任务,FG-RCA通过自适应频域特征调制,有效增强了两种模态信息的交互,提升了跨模态检测能力。

3. 高效图像分割任务:借助频域信息优化和残差融合,FG-RCA适用于医学图像分割、遥感图像分析等任务,特别是在图像中的边界和细节提取方面表现突出。

4. 深度学习模型增强任务:作为深度网络(如CNN、Transformer)的增强模块,FG-RCA能够提升模型对复杂图像信息的表达与处理能力,尤其适合需要处理大量复杂图像数据的任务。

    📌 总结对比
    FRCA:强调 傅里叶变换 + 残差通道注意力,突出频域信息的优化和高频信息的增强,适合显著性目标检测与复杂图像分析任务。
    FG-RCA:在 FRCA 的基础上引入 傅里叶门控机制 + 残差融合,适合复杂图像分析、跨模态任务与深度模型增强,提供更强的跨域特征融合能力。

07 运行结果与即插即用代码

运行结果

 🎯 FRCA模块

image.png

 🎯 FG-RCA模块

image.png

本文代码获取

立即加星标

每天看好文

image.png

image.png

扫码关注

福高照 祭灶神

扫尘土 贴窗花

http://www.dtcms.com/a/411683.html

相关文章:

  • 网站空间期限查询企业取名字
  • 不良网站进入窗口免费正能量网站经营性备案需要什么资料
  • 摄影网站建设的功能有哪些不会编程 做网站
  • JVM 类加载
  • golang如何四舍五入到2位小数
  • ps临摹图片做网站的图片犯法吗黄冈贴吧
  • 天津智能网站建设哪里有北京太阳宫网站建设
  • 深圳网站建设的费用宁波公司名称大全
  • 国家建设部网站wordpress最新中文版
  • 商河大模型-网易智企发布的客服领域行业大模型
  • 国家电力安全网站两学一做企业电子商务网站平台建设
  • 网站建设软件公司唯爱wordpress主题
  • 用 PyTorch 搞定 CIFAR10 数据集
  • VLMs距离空间智能还有多远的路要走?
  • 做网站北京德国网站建设
  • 网站建立安全连接失败软装设计公司加盟
  • 搭建个人博客:云服务器IP如何使用
  • iis网站asp.net部署网站建设运营费计入什么科目
  • 建设外贸营销型网站需要什么青岛网站设计定制
  • 券商 做网站圣都装饰的口碑怎么样
  • 【算法训练营Day26】动态规划part2
  • 河北衡水建设网站公司电话wordpress ajax登录插件
  • 网站源码怎么搭建最新新闻热点事件2023年10月
  • 城乡建设部网站广州市国外学校网站设计
  • 泊头网站建设公司wordpress删除主题之后
  • 一站式营销平台wordpress学校网站模板
  • LeetCode 算法题【简单】338. 比特位计数
  • 买房网站排名福州做网站建设公司
  • 爱思强交付第100套G10-SiC系统
  • 网站的建设要多少钱求推荐专门做借条的网站