SPATA2·在空转中推断组织学相关基因表达梯度
SPATA2整合了差异表达、基因富集、单细胞反卷积、拷贝数推断(inferCNV)等模块,形成从数据预处理到生物学解释的一体化流程,适用于复杂疾病微环境的空间多组学研究。
本篇文章主要介绍了SPATA2包中的空间梯度筛选(Spatial Gradient Screening, SGS)算法,这是一种无需预先分组的空间转录组分析方法,旨在从连续空间坐标中识别与组织结构(如坏死区、低氧区等)相关的非随机基因表达梯度,主要包含以下几个核心步骤:
-
选择空间参考特征(Spatial Features):可以是图像注释的组织区域(如坏死中心)、也可以是空间轨迹(如从肿瘤核心到边缘的方向)。
-
距离计算与表达拟合:所有数据点都根据其到参考特征的距离进行排序,使用 LOESS 局部回归模型对每个基因的表达进行拟合,生成表达梯度曲线。
-
随机性检验与显著性筛选:构建一个表达估计值的梯度向量,并计算总变异度(Total Variation, TV)来评估梯度平滑度,比较观测梯度与模拟数据,获得显著性 p 值。
-
模型拟合与归类:提供三种标准表达模式模型:递减(association pattern)、峰值型(layered pattern)、递增(recovery pattern),计算均方误差(RMSE)或平均绝对误差(MAE),筛选符合特定生物学模式的基因。
实现工具:SPATA2 R 包
1. 提供可视化、图像注释、轨迹构建、梯度拟合和下游分析全流程。
2. 支持 Visium、MERFISH、SlideSeq、Xenium 等多平台。
3. 与 Seurat、Giotto、AnnData 等生态系统兼容
参考:Package index • SPATA2
Nature Communications, 2024,15:7280.