当前位置: 首页 > news >正文

(即插即用模块-特征处理部分) 四十五、(2024 TGRS) SFF 浅层特征融合模块

在这里插入图片描述

文章目录

  • 1、Shallow-level Feature Fusion
  • 2、代码实现

paper:A Multilevel Multimodal Fusion Transformer for Remote Sensing Semantic Segmentation

Code:https://github.com/sstary/SSRS


1、Shallow-level Feature Fusion

弥补传统融合方法的不足:现有的多模态融合方法通常只关注深层特征融合,忽略了浅层特征中包含的丰富细节信息。解决不同模态数据的异质性:不同模态数据之间存在统计特性和噪声水平的差异,直接融合可能会导致信息丢失或混淆。降低对 DSM 数据的依赖:DSM 数据虽然可以提供重要的高度信息,但其获取成本较高。SFF 模块可以降低对 DSM 数据的依赖,即使在缺少 DSM 数据的情况下,也能取得较好的分割效果。而这篇论文提出一种 浅层特征融合模块(Shallow-level Feature Fusion Module),SFF 模块通过融合浅层特征,可以更好地保留物体细节,例如形状、边界、颜色和纹理等,从而提高分割精度。

SFF 模块的核心思想是利用卷积神经网络 (CNN) 的局部感知能力,分别提取不同模态数据的浅层特征,并进行融合。具体来说,SFF 模块包含两个分支,分别处理可见光图像 (VIS) 和 DSM 数据:

SFF 模块的实现过程如下:

  1. 特征提取:使用 CNN 分别提取 VIS 和 DSM 数据的浅层特征。
  2. Squeeze-and-Excitation (SE) 模块:使用 SE 模块对聚合后的特征进行通道注意力建模,增强重要特征并抑制不相关特征。
  3. 特征融合:将两个分支的特征进行加权求和,得到最终的浅层特征表示。

Shallow-level Feature Fusion 结构图:
在这里插入图片描述


2、代码实现

import torch
import torch.nn as nn""" 官方github里没找到代码,但结构不复杂,复现了一下 """
class SELayer(nn.Module):def __init__(self, channel, reduction=16):super(SELayer, self).__init__()self.avg_pool = nn.AdaptiveAvgPool2d(1)self.fc = nn.Sequential(nn.Linear(channel, channel // reduction, bias=False),nn.ReLU(inplace=True),nn.Linear(channel // reduction, channel, bias=False),nn.Sigmoid())def forward(self, x):b, c, _, _ = x.size()y = self.avg_pool(x).view(b, c)y = self.fc(y).view(b, c, 1, 1)return x * y.expand_as(x)class SFF(nn.Module):def __init__(self, in_channels):super(SFF, self).__init__()self.se = SELayer(in_channels)def forward(self, dms, vis):dms = self.se(dms)vis = self.se(vis)return dms + visif __name__ == '__main__':x = torch.randn(4, 16, 128, 128).cuda()y = torch.randn(4, 16, 128, 128).cuda()model = SFF(16).cuda()out = model(x,y)print(out.shape)

文章转载自:

http://0znlS9A0.jpgfx.cn
http://9VlprLVw.jpgfx.cn
http://rc1Ft2Eq.jpgfx.cn
http://06mC3hQo.jpgfx.cn
http://1Z9btdRG.jpgfx.cn
http://xAxqZfdJ.jpgfx.cn
http://bFYVKthW.jpgfx.cn
http://yAgskhIW.jpgfx.cn
http://7LkcrqhD.jpgfx.cn
http://FNEKOPc4.jpgfx.cn
http://jQBGnorI.jpgfx.cn
http://8TapUwQr.jpgfx.cn
http://6uTcdvTa.jpgfx.cn
http://Z9WJky6x.jpgfx.cn
http://2yNu5K6N.jpgfx.cn
http://SxOQ0a0I.jpgfx.cn
http://Ec4MGowP.jpgfx.cn
http://m7oWxlZb.jpgfx.cn
http://spUkkeTo.jpgfx.cn
http://x7hZr4qc.jpgfx.cn
http://Tg29OI5I.jpgfx.cn
http://lpluOa5y.jpgfx.cn
http://a4WuXdCo.jpgfx.cn
http://QhZCvyD3.jpgfx.cn
http://ErXeVbUH.jpgfx.cn
http://xL1s231m.jpgfx.cn
http://gZm1dj9z.jpgfx.cn
http://z1iZ6KeL.jpgfx.cn
http://4eTPmXoO.jpgfx.cn
http://NydmGmRV.jpgfx.cn
http://www.dtcms.com/a/165371.html

相关文章:

  • WebRtc09:网络基础P2P/STUN/TURN/ICE
  • [实战] Petalinux驱动开发以及代码框架解读
  • IBM WebSphere Application Server 7.0/8.5.5证书过期问题处理
  • firecrawl的docker安装和api调用
  • 【python】-基础语法3
  • flutter开发音乐APP(简单的音乐播放demo)
  • Android Compose 无网络状态处理全指南:从基础到高级实践
  • 家庭服务器IPV6搭建无限邮箱系统指南
  • 米壳AI:跨境电商图片翻译的“隐形革命”:当AI技术遇上全球化生意
  • 每日算法-250430
  • 高性能架构设计-分库分表
  • 2025上海车展 | 移远通信推出自研NG-eCall QuecOpen方案,助力汽车安全新标准加速落地
  • AVPro Video加载视频文件并播放,可指定视频文件的位置、路径等参数
  • 海外社交软件开发进阶:AI驱动与高可用架构的深度实践
  • 极品工具箱 1.3.7 | 多功能合一的工具箱,涵盖音乐搜索、短视频解析等特色功能
  • 电子病历高质量语料库构建方法与架构项目(临床情景理解模块篇)
  • 【综述】相位解包裹算法对比分析
  • LVGL -按键介绍 下
  • (51单片机)LCD显示红外遥控相关数据(Delay延时函数)(LCD1602教程)(Int0和Timer0外部中断教程)(IR红外遥控模块教程)
  • 大连理工大学选修课——机器学习笔记(5):EMK-Means
  • 《软件设计师》复习笔记(10.1)——算法特性、时间复杂度、递归、分治、动态规划
  • flutter 专题 六十四 在原生项目中集成Flutter
  • 应对过度处方挑战:为药物推荐任务微调大语言模型(Xiangnan He)
  • 4.29[Q]NLP-Exp2
  • pycharm导入同目录下文件未标红但报错ModuleNotFoundError
  • Locate 3D:Meta出品自监督学习3D定位方法
  • 03_Mybatis-Plus LambadaQueryWrapper 表达式爆空指针异常
  • 大数据应用开发和项目实战-Seaborn
  • Python-pandas-操作csv文件(读取数据/写入数据)及csv语法详细分享
  • python + segno 生成个人二维码