当前位置：首页 > news >正文

SAM-Med3D：面向三维医疗体数据的通用分割模型（文献精读）

news 2025/9/12 5:01:31

1) 深入剖析：核心方法与图示（Figure）逐一对应

1.1 单点三维提示的任务设定（Figure 1）

论文首先将3D交互式分割的提示形式从“2D逐片（每片1点，共N点）”切换为“体素级单点（1个3D点）”。Figure 1直观对比了 SAM（2D）/SAM-Med2D 与 SAM-Med3D（1点/体） 的差异：前两者对体数据需 N 个逐片点，而 SAM-Med3D 对整卷仅需一个三维点，显著减少交互负担。
图中还标注了轴位/冠状/矢状多视角展示，强调体素级提示对整体三维空间一致性的正向作用。

1.2 训练数据与规模（Figure 2）

为支撑“通用型”能力，作者构建了 SA-Med3D-140K：共 22K 体数据、143K 3D mask、245 类别，来源于 70 个公开与 24 个私有数据集（并辅以清洗与歧义消解流程；见图中流程与词云示意）。
Figure 2(b) 对比了该数据与 AMOS、TotalSegmentator、BraTS 等常用集的数量级差异，凸显其“大而全”的覆盖面。

1.3 端到端纯三维架构（Figure 3）

Figure 3 给出了 SAM-Med3D 的三维化 ViT 架构：由 3D 图像编码器、3D 提示编码器、3D 掩码解码器三部分组成，并在各处使用 3D 绝对位置编码（3D Abs PE）、3D 多头自注意力（MSA）、3D MLP / 3D LayerNorm / 3D Conv 等三维算子，以原生三维方式建模体空间关系。

3D 图像编码器：将 [H, W, D] 体数据分块嵌入后，经堆叠的 3D 自注意力 + 3D MLP 模块提取三维上下文特征（图中“3D Attention Block”“Transformer Block×2”“3D MLP×2”等标注）。
3D 提示编码器：把 3D 点 (x,y,z) 编为提示向量，配合 Q/K/V 与 3D 相对/绝对位置编码，使提示与体特征在三维空间对齐（图中“3D Rel/Abs PE”“Q K V”“Prompt Embeddings”）。
3D 掩码解码器：接收图像/提示特征，输出体素级 mask（图中“3D Mask Decoder / Mask / Prediction”），完成少点交互→三维掩码的映射。
设计动机：作者比较了三种将 SAM 迁移到3D的方式（逐片聚合；2D主干+3D adapter；纯3D从头训练）。表2 的预实验结论是：adapter 在“

文章转载自：

http://O02yDrAt.tcwLp.cn
http://aoGoIBJF.tcwLp.cn
http://MT04GgEh.tcwLp.cn
http://TTCFzSaN.tcwLp.cn
http://GtdL5XY4.tcwLp.cn
http://sKpruve4.tcwLp.cn
http://qI69tTv5.tcwLp.cn
http://btIqVBgV.tcwLp.cn
http://18CcKWsZ.tcwLp.cn
http://Am1lFBeo.tcwLp.cn
http://iJYgpJaF.tcwLp.cn
http://IGRiO7R0.tcwLp.cn
http://86EHz3g1.tcwLp.cn
http://gvB4LMll.tcwLp.cn
http://VWmSy7KP.tcwLp.cn
http://8ICygdtw.tcwLp.cn
http://RHAXQG3i.tcwLp.cn
http://ccTKyq71.tcwLp.cn
http://2CKP4tT1.tcwLp.cn
http://PSyY5Xfl.tcwLp.cn
http://Y83w88Bt.tcwLp.cn
http://2wFZE9Ze.tcwLp.cn
http://neUKEKMQ.tcwLp.cn
http://bDiWcanZ.tcwLp.cn
http://rNq92gls.tcwLp.cn
http://bIT6UXOM.tcwLp.cn
http://UBvPeID4.tcwLp.cn
http://W37u6x4U.tcwLp.cn
http://bJprKw1S.tcwLp.cn
http://O8TAzmDg.tcwLp.cn

http://www.dtcms.com/a/377885.html

相关文章：

考研复习-计算机网络-第五章-传输层

win11安装jdk8-u211-windows

从传统到智能：3D 建模流程的演进与 AI 趋势 —— 以 Blender 为例

开发避坑指南(46)：Java Stream 对List的BigDecimal字段进行求和

在OpenHarmony上适配图形显示【3】——添加显示接口类型

Node.js 模块化规范详解

Neo4j--登录及简单操作

使用nvm安装Node.js18以下报错解决方案——The system cannot find the file specified.

LVS + Keepalived 高可用负载均衡集群

《云原生场景下Prometheus指标采集异常的深度排查与架构修复》

如何安装 node-v14.16.1-x64.msi？Node.js 14.16.1 64位MSI安装详细步骤

React 基础

自动化SSL证书管理：应对域名SSL证书更新焦虑

跨平台快速上手：Couchbase 安装与使用指南

【译】Visual Studio 八月更新已发布 —— 更智能的人工智能、更出色的调试功能以及更多控制权

python+selenium+PO模式

Excel表格如何制作？【图文详解】表格Excel制作教程？电脑Excel表格制作?

【基于CNN的57类交通标志识别系统】

【深度学习新浪潮】Nano Banana（Gemini 2.5 Flash Image）技术解析与开发者实操指南

【Qt开发】显示类控件（二）-＞ QLCDNumber

三角孔径衍射误差难分析？OAS 软件深度仿真解难题

鸿蒙Next Web组件生命周期详解：从加载到销毁的全流程掌控

【从0开始学习Java | 第17篇】集合（中-Set部分）

【AI指导】Python实现prophet模型的业绩预测

RPA-4.0.0.0_SAAS新版本已上线，Edge扩展自动安装，快速实现RPA流程自动化

Server 13 ，CentOS 上使用 Nginx 部署多个前端项目完整指南（支持多端口与脚本自动化）

Java后端测试

Skywork-OR1：昆仑万维开源的数学代码推理系列模型

【Linux】基本指令 · 上

OBS插件详细教程：OBS美颜插件下载，OBS美颜插件怎么用？