当前位置: 首页 > news >正文

SAM-Med3D:面向三维医疗体数据的通用分割模型(文献精读)

1) 深入剖析:核心方法与图示(Figure)逐一对应

1.1 单点三维提示的任务设定(Figure 1)

  • 论文首先将3D交互式分割的提示形式从“2D逐片(每片1点,共N点)”切换为“体素级单点(1个3D点)”。Figure 1直观对比了 SAM(2D)/SAM-Med2D 与 SAM-Med3D(1点/体) 的差异:前两者对体数据需 N 个逐片点,而 SAM-Med3D 对整卷仅需一个三维点,显著减少交互负担。
  • 图中还标注了轴位/冠状/矢状多视角展示,强调体素级提示对整体三维空间一致性的正向作用。
    在这里插入图片描述

1.2 训练数据与规模(Figure 2)

  • 为支撑“通用型”能力,作者构建了 SA-Med3D-140K:共 22K 体数据、143K 3D mask、245 类别,来源于 70 个公开与 24 个私有数据集(并辅以清洗与歧义消解流程;见图中流程与词云示意)。
  • Figure 2(b) 对比了该数据与 AMOS、TotalSegmentator、BraTS 等常用集的数量级差异,凸显其“大而全”的覆盖面。
    在这里插入图片描述

1.3 端到端纯三维架构(Figure 3)

Figure 3 给出了 SAM-Med3D 的三维化 ViT 架构:由 3D 图像编码器、3D 提示编码器、3D 掩码解码器三部分组成,并在各处使用 3D 绝对位置编码(3D Abs PE)3D 多头自注意力(MSA)3D MLP / 3D LayerNorm / 3D Conv 等三维算子,以原生三维方式建模体空间关系。

  • 3D 图像编码器:将 [H, W, D] 体数据分块嵌入后,经堆叠的 3D 自注意力 + 3D MLP 模块提取三维上下文特征(图中“3D Attention Block”“Transformer Block×2”“3D MLP×2”等标注)。
  • 3D 提示编码器:把 3D 点 (x,y,z) 编为提示向量,配合 Q/K/V 与 3D 相对/绝对位置编码,使提示与体特征在三维空间对齐(图中“3D Rel/Abs PE”“Q K V”“Prompt Embeddings”)。
  • 3D 掩码解码器:接收图像/提示特征,输出体素级 mask(图中“3D Mask Decoder / Mask / Prediction”),完成少点交互→三维掩码的映射。
  • 设计动机:作者比较了三种将 SAM 迁移到3D的方式(逐片聚合;2D主干+3D adapter;纯3D从头训练)。表2 的预实验结论是:adapter 在“

文章转载自:

http://O02yDrAt.tcwLp.cn
http://aoGoIBJF.tcwLp.cn
http://MT04GgEh.tcwLp.cn
http://TTCFzSaN.tcwLp.cn
http://GtdL5XY4.tcwLp.cn
http://sKpruve4.tcwLp.cn
http://qI69tTv5.tcwLp.cn
http://btIqVBgV.tcwLp.cn
http://18CcKWsZ.tcwLp.cn
http://Am1lFBeo.tcwLp.cn
http://iJYgpJaF.tcwLp.cn
http://IGRiO7R0.tcwLp.cn
http://86EHz3g1.tcwLp.cn
http://gvB4LMll.tcwLp.cn
http://VWmSy7KP.tcwLp.cn
http://8ICygdtw.tcwLp.cn
http://RHAXQG3i.tcwLp.cn
http://ccTKyq71.tcwLp.cn
http://2CKP4tT1.tcwLp.cn
http://PSyY5Xfl.tcwLp.cn
http://Y83w88Bt.tcwLp.cn
http://2wFZE9Ze.tcwLp.cn
http://neUKEKMQ.tcwLp.cn
http://bDiWcanZ.tcwLp.cn
http://rNq92gls.tcwLp.cn
http://bIT6UXOM.tcwLp.cn
http://UBvPeID4.tcwLp.cn
http://W37u6x4U.tcwLp.cn
http://bJprKw1S.tcwLp.cn
http://O8TAzmDg.tcwLp.cn
http://www.dtcms.com/a/377885.html

相关文章:

  • 考研复习-计算机网络-第五章-传输层
  • win11安装jdk8-u211-windows
  • 从传统到智能:3D 建模流程的演进与 AI 趋势 —— 以 Blender 为例
  • 开发避坑指南(46):Java Stream 对List的BigDecimal字段进行求和
  • 在OpenHarmony上适配图形显示【3】——添加显示接口类型
  • Node.js 模块化规范详解
  • Neo4j--登录及简单操作
  • 使用nvm安装Node.js18以下报错解决方案——The system cannot find the file specified.
  • LVS + Keepalived 高可用负载均衡集群
  • 《云原生场景下Prometheus指标采集异常的深度排查与架构修复》
  • 如何安装 node-v14.16.1-x64.msi?Node.js 14.16.1 64位MSI安装详细步骤
  • React 基础
  • 自动化SSL证书管理:应对域名SSL证书更新焦虑
  • 跨平台快速上手:Couchbase 安装与使用指南
  • 【译】Visual Studio 八月更新已发布 —— 更智能的人工智能、更出色的调试功能以及更多控制权
  • python+selenium+PO模式
  • Excel表格如何制作?【图文详解】表格Excel制作教程?电脑Excel表格制作?
  • 【基于CNN的57类交通标志识别系统】
  • 【深度学习新浪潮】Nano Banana(Gemini 2.5 Flash Image)技术解析与开发者实操指南
  • 【Qt开发】显示类控件(二)-> QLCDNumber
  • 三角孔径衍射误差难分析?OAS 软件深度仿真解难题
  • 鸿蒙Next Web组件生命周期详解:从加载到销毁的全流程掌控
  • 【从0开始学习Java | 第17篇】集合(中-Set部分)
  • 【AI指导】Python实现prophet模型的业绩预测
  • RPA-4.0.0.0_SAAS新版本已上线,Edge扩展自动安装,快速实现RPA流程自动化
  • Server 13 ,CentOS 上使用 Nginx 部署多个前端项目完整指南( 支持多端口与脚本自动化 )
  • Java后端测试
  • Skywork-OR1:昆仑万维开源的数学代码推理系列模型
  • 【Linux】基本指令 · 上
  • OBS插件详细教程:OBS美颜插件下载,OBS美颜插件怎么用?