当前位置: 首页 > news >正文

(即插即用模块-特征处理部分) 四十五、(2024 TGRS) SFF 浅层特征融合模块

在这里插入图片描述

文章目录

  • 1、Shallow-level Feature Fusion
  • 2、代码实现

paper:A Multilevel Multimodal Fusion Transformer for Remote Sensing Semantic Segmentation

Code:https://github.com/sstary/SSRS


1、Shallow-level Feature Fusion

弥补传统融合方法的不足:现有的多模态融合方法通常只关注深层特征融合,忽略了浅层特征中包含的丰富细节信息。解决不同模态数据的异质性:不同模态数据之间存在统计特性和噪声水平的差异,直接融合可能会导致信息丢失或混淆。降低对 DSM 数据的依赖:DSM 数据虽然可以提供重要的高度信息,但其获取成本较高。SFF 模块可以降低对 DSM 数据的依赖,即使在缺少 DSM 数据的情况下,也能取得较好的分割效果。而这篇论文提出一种 浅层特征融合模块(Shallow-level Feature Fusion Module),SFF 模块通过融合浅层特征,可以更好地保留物体细节,例如形状、边界、颜色和纹理等,从而提高分割精度。

SFF 模块的核心思想是利用卷积神经网络 (CNN) 的局部感知能力,分别提取不同模态数据的浅层特征,并进行融合。具体来说,SFF 模块包含两个分支,分别处理可见光图像 (VIS) 和 DSM 数据:

SFF 模块的实现过程如下:

  1. 特征提取:使用 CNN 分别提取 VIS 和 DSM 数据的浅层特征。
  2. Squeeze-and-Excitation (SE) 模块:使用 SE 模块对聚合后的特征进行通道注意力建模,增强重要特征并抑制不相关特征。
  3. 特征融合:将两个分支的特征进行加权求和,得到最终的浅层特征表示。

Shallow-level Feature Fusion 结构图:
在这里插入图片描述


2、代码实现

import torch
import torch.nn as nn""" 官方github里没找到代码,但结构不复杂,复现了一下 """
class SELayer(nn.Module):def __init__(self, channel, reduction=16):super(SELayer, self).__init__()self.avg_pool = nn.AdaptiveAvgPool2d(1)self.fc = nn.Sequential(nn.Linear(channel, channel // reduction, bias=False),nn.ReLU(inplace=True),nn.Linear(channel // reduction, channel, bias=False),nn.Sigmoid())def forward(self, x):b, c, _, _ = x.size()y = self.avg_pool(x).view(b, c)y = self.fc(y).view(b, c, 1, 1)return x * y.expand_as(x)class SFF(nn.Module):def __init__(self, in_channels):super(SFF, self).__init__()self.se = SELayer(in_channels)def forward(self, dms, vis):dms = self.se(dms)vis = self.se(vis)return dms + visif __name__ == '__main__':x = torch.randn(4, 16, 128, 128).cuda()y = torch.randn(4, 16, 128, 128).cuda()model = SFF(16).cuda()out = model(x,y)print(out.shape)

相关文章:

  • WebRtc09:网络基础P2P/STUN/TURN/ICE
  • [实战] Petalinux驱动开发以及代码框架解读
  • IBM WebSphere Application Server 7.0/8.5.5证书过期问题处理
  • firecrawl的docker安装和api调用
  • 【python】-基础语法3
  • flutter开发音乐APP(简单的音乐播放demo)
  • Android Compose 无网络状态处理全指南:从基础到高级实践
  • 家庭服务器IPV6搭建无限邮箱系统指南
  • 米壳AI:跨境电商图片翻译的“隐形革命”:当AI技术遇上全球化生意
  • 每日算法-250430
  • 高性能架构设计-分库分表
  • 2025上海车展 | 移远通信推出自研NG-eCall QuecOpen方案,助力汽车安全新标准加速落地
  • AVPro Video加载视频文件并播放,可指定视频文件的位置、路径等参数
  • 海外社交软件开发进阶:AI驱动与高可用架构的深度实践
  • 极品工具箱 1.3.7 | 多功能合一的工具箱,涵盖音乐搜索、短视频解析等特色功能
  • 电子病历高质量语料库构建方法与架构项目(临床情景理解模块篇)
  • 【综述】相位解包裹算法对比分析
  • LVGL -按键介绍 下
  • (51单片机)LCD显示红外遥控相关数据(Delay延时函数)(LCD1602教程)(Int0和Timer0外部中断教程)(IR红外遥控模块教程)
  • 大连理工大学选修课——机器学习笔记(5):EMK-Means
  • 北京亦庄启动青年人才创新创业生态示范区
  • 海尔智家一季度营收791亿元:净利润增长15%,海外市场收入增超12%
  • 交行一季度净利253.72亿元增1.54%,不良率微降
  • 中国银行副行长刘进任该行党委副书记
  • 83岁连丽如每周登台说书,还上了15堂连派评书课
  • 西班牙葡萄牙电力基本恢复