当前位置: 首页 > news >正文

一种用于医学图像分割的使用了多尺寸注意力Transformer的混合模型: HyTransMA


核心内容: 我是菜鸡!我是菜鸡!我是菜鸡!

如果老师及学姐学长对该文有任何意见,请您随时告诉我,我随时可以删除这篇文章(非常非常真诚)!

如果我有内容解释有误或不够清晰也请随时告诉我,我随时会对文章进行调整。

HyTransMA: A Hybrid Model Using Transformer with Multi-scale Attentions for Medical Image Segmentation

一种用于医学图像分割的使用了多尺寸注意力Transformer的混合模型: HyTransMA

核心内容

将Transformer和卷积网络进行了结合,使用卷积神经网络Resnet和Swin Transformer作为不同的分支,从两种角度对图像的特征进行提取,再用MSA多头注意力来得到最终的结果。

模型结构

在这里插入图片描述

其中蓝色的部分为Swin Transformer

绿色的部分为卷积Resnet

黄色的部分则为多头MSA

在编码阶段,一共三次将Swin Transformer和Resnet的相同尺寸的特征融合在一起,所以一共产生了三种不同尺寸的特征,分别对应了三次concat。

在解码阶段,则主要使用UpBlock上采样,来统一不同尺寸的输入。

与TransUNet 作对比

本文与TransUNet一样,同样都是在医学图像分割方向,并将卷积与Transformer结合在了一起,但是结合的方式有很大区别。

结合方式

在TransUNet中,Transformer实际处理的是由卷积模型提取出的特征。

而在本文中,Transformer与卷积模型分别提取了图像的特征。

个人参考

  1. Swin Transformer 原文

  2. Swin Transformer讲述很好的博客

  3. TransUNet

碎碎念

1.目前看近一两年看到的图像相关论文,有很多的图像问题都已经在使用Transformer来替代卷积。

但是Transformer确实缺乏足够的局部特征提取能力,不知道未来是否有相关的技术可以直接的解决这些问题。

2.TransUNet使用的应该是相对传统的VIT,那么如果切换到Swin Transformer是否会有提高,可以提高到什么程度。

或者说,本文和TransUNet不同的处理及提取特征的方式,对应侧重点是什么呢,这些需要进一步分析。

3.如果需要深入研究这一领域知识的话,需要把表单中其他的算法继续研究一下。

可以看出大部分模型都有不同的侧重点,如果能够深入分析出为什么可以表现出这种侧重就好了。

在这里插入图片描述

4.未来再回过头在补充吧,还有一些包括训练策略在内容的内容我们还没有看,可以再从paperconnect再看一下。

http://www.dtcms.com/a/279254.html

相关文章:

  • SecretFlow 隐语 (2) --- 隐语架构概览
  • SQL性能调优经验总结
  • Redis缓存解决方案
  • Laravel 中 chunk 分页漏掉数据?深度解析原因与解决方案
  • 深度剖析:动态接口代理核心原理与高级应用
  • 工业4.0时代的安全管理:2025年物联网与AI技术的融合与10+工具实践
  • NSSCTF Web 一点学习
  • 高安全前端架构:Rust-WASM 黑盒技术揭秘
  • 机器学习、深度学习、神经网络之间的关系
  • Binder 概述
  • Linux操作系统从入门到实战(七)详细讲解编辑器Vim
  • 第二章 uniapp实现兼容多端的树状族谱关系图,封装tree-item子组件
  • 自学鸿蒙测试day0
  • 专题:2025机器人产业深度洞察报告|附136份报告PDF与数据下载
  • UDP协议的端口161怎么检测连通性
  • uniapp video视频全屏播放后退出,页面字体变大,样式混乱问题
  • 基于微信小程序停车场车位预约系统的设计与实现
  • 基于微信小程序的财务管理系统的设计与实现;账本管理系统的设计与实现
  • Browser MCP
  • 【PY32】如何使用 J-Link 和 MDK 开发调试 PY32 MCU
  • 第十九篇 自动化报表生成:Python一键生成可视化Excel图表与专业PDF报告,老板看了都点赞!
  • iOS 抓包工具评测:功能、限制与真实开发场景全解析
  • Spark SQL 之 UT
  • 人工智能在气候变化应对中的战略角色:从感知、模拟到决策支持
  • JAVA面试宝典 -《Spring Cloud Alibaba 实战:从限流到熔断》
  • AI多因子模型解析黄金3370美元:避险需求驱动与美欧墨关税升级的联动效应
  • 即刻开发:接入淘宝关键词搜索 API 采集海量商品数据
  • Linux 0.11 中,磁盘分区信息
  • win10安装Elasticsearch
  • 学习C++、QT---24(QT实现记事本项目的打开、保存、关闭)