MRI大型数据集FastMRI介绍
数据介绍
fastMRI 是 NYU Langone Health 与 Meta AI Research(前 Facebook AI Research)合作推出的一个大型开源 MRI 数据集,旨在推动基于机器学习的 MR 图像重建研究。该数据集同时提供原始 k-空间(k-space)HDF5 文件和临床重建后的 DICOM 图像,覆盖膝关节、脑部、前列腺,以及最新加入的乳腺扫描,能够兼顾理想化算法验证与真实临床场景泛化。
官网链接:https://fastmri.med.nyu.edu/
数据集组成
原始 k-空间 数据(HDF5 格式)
-
膝关节数据:包含约 1,500 例在 1.5 T 和 3 T 磁体上全采样的膝关节 MRI 扫描,原始数据为多线圈复数 k-空间,后处理中心裁剪至 320×320 并分别生成单线圈(ESC)和多线圈(RSS)重建图像。
-
脑部数据:收录约 6,970 例在 1.5 T 和 3 T 磁体上全采样的脑部 MRI,包括轴向 T1 加权、T2 加权和 FLAIR 序列(部分 T1 序列含造影),在 1.5 T 和 3 T 上的扫描数量合计 7,002 例。
-
前列腺数据:提供 312 例 3 T 前列腺 MRI,包含轴向 T2 加权和扩散加权序列,文件名均以
file_prostate_<sequence>_<fastmriID>.h5
命名,支持根据序列选择下载。 -
乳腺数据:新增 300 例 3 T 乳腺 DCE-MRI 原始 k-空间数据,采用径向动态对比增强采集,每例保存为单独的 HDF5,包含 4 维(x, y, z, time)图像序列及采集参数,并同期提供 DICOM 版本以提升易用性。
文件大小与格式
-
总存储量:HDF5 原始 k-空间数据总计约 1.35 TB,划分为
multicoil_train
(931 GB)、multicoil_val
(192 GB)和multicoil_test
(109 GB)三个下载包,以便差异化使用。 -
HDF5 结构:每个
.h5
文件通常包含以下关键字段:-
kspace
:形状为(slices, coils, H, W)
的复数 k-空间数据 -
reconstruction_esc
:模拟单线圈 IFFT 后取绝对值得到的图像 -
reconstruction_rss
:对各线圈 IFFT 幅值平方求和再开方得到的 RSS 图像 -
ISMRMRD XML 头信息:记录扫描参数(矩阵大小、编码次数等)。
-
-
临床 DICOM 图像
-
膝关节 DICOM:提供 10,012 例来自 9,290 名患者的临床加速膝关节 MRI 图像,包含冠状位质子密度(带/不带脂肪抑制)、轴向质子密度脂肪抑制、矢状位质子密度及矢状位 T2 脂肪抑制序列。使用各厂商并行成像算法重建;与 raw k-space 数据并非同一批次,也不保证同一患者出现于两者中。
-
脑部DICOM:10 000 例独立患者的常规 T1/T2/FLAIR 扫描,且与 raw k-space数据无任何患者重复
-
前列腺与乳腺 DICOM:前列腺(312 例)和乳腺(300 例)数据集中,DICOM 与 HDF5 一一对应,文件夹以相同的 fastMRI ID 编排,便于联合标签和联合分析。
访问与使用
所有 fastMRI 数据均需在线申请、签署数据使用协议并说明研究用途,数据仅限内部研究和教育,不可二次分发。