数据库——转录组数据库大全
以下是常用的转录组数据库,转载于网上最全的空间转录组数据库大汇总
STOmicsDB 数据库
该数据库于2024年1月5号发表在NAR杂志上,文献标题为《STOmicsDB: a comprehensive database for spatial transcriptomics data sharing, analysis and visualization》,发表单位来自深圳国家基因库和深圳华大生命科学研究院。
该数据库整合了17 个物种,数据更新到了360个空间转录组数据,网址为:https://db.cngb.org/stomics/,里面的数据基本上都是提供的h5ad格式的数据:
SpatialDB 数据库
这个数据库于2020年1月8号发表在NAR杂志上,文献标题为《SpatialDB: a database for spatially resolved transcriptomes》。发表单位为:中国科学院生物物理研究所,大名鼎鼎的陈润生院士团队。
该数据库包括5个物种(人类、小鼠、果蝇、秀丽隐杆线虫和斑马鱼)的24个空间转录组数据集,网址为:http://spatialomics.org/SpatialDB/index.php
数据下载都是一个压缩包:
SPASCER 数据库
2023年发表在NAR杂志,文献标题《SPASCER: spatial transcriptomics annotation at single-cell resolution》。
SPASCER全称为spatial transcriptomics annotation at single-cell resolution,是专为空间转录组数据建立的注释数据库。该数据库收集了来自4个物种(人,小鼠,鸡,斑马鱼)的16个器官类型(胚胎,脑,脊髓,心脏,肺,乳房,肝脏,胰腺,淋巴,肾脏,前列腺,膀胱,睾丸,皮肤,子宫,和肠道)的1082个数据集。数据库网址为:https://ccsm.uth.edu/SPASCER
四个物种的数据分布:
数据下载也是提供的一个压缩包:
SODB 数据库
该数据库2023 年在《Nature Methods》发表,附带Python开发的软件工具,文献标题为《SODB facilitates comprehensive exploration of spatial omics data》。
数据库包括25种以上空间组学技术的2400多个实验数据,这些数据以统一的数据格式提供,兼容多种计算软件包,并且可以免费获取。SODB还提供多种交互式数据分析模块,特别是独特的空间组学视图(Spatial Omics View,简称SOView)模块。数据库网址为:https://gene.ai.tencent.com/SpatialOmics/
数据统计:基本上下载也是提供的h5ad格式。
CROST 数据库
于2024年发表在NAR杂志上,文献标题《CROST: a comprehensive repository of spatial transcriptomics》。
是一个空间转录组学的综合数据库,包括了182 个空间转录组数据集,涵盖来自 8 个不同物种( (Homo sapiens, Mus musculus, Danio rerio, Gallus gallus, Canis lupus familiaris, Phalaenopsis aphrodite and Rattus norvegicus))、35 种组织和 56 种疾病的 1033 个样本。针对单个样本提供了全面的生物信息分析,包括空间变异基因(SVG)分析、细胞类型注释、空间相关性、空间共定位、通讯分析和功能注释等。数据库网址:https://ngdc.cncb.ac.cn/crost/
最新数据统计如下:提供h5格式下载
SpatialData 数据库
2024年3月发表在Nature Methods杂志上,文献标题《SpatialData: an open and universal data framework for spatial omics》。SpatialData是一个建立统一、可扩展的多平台文件格式的框架——SpatialData,为空间注释和跨模态聚合与分析提供便利, 是个分析框架,也有一些数据。
数据库网址为:https://spatialdata.scverse.org/en/latest/tutorials/notebooks/datasets/README.html
CancerSRT 数据库
2024年发表在J Genet Genomics. 杂志上,文献标题《CancerSRT: a spatially resolved transcriptomics database for human cancers》。这是一个人类癌症空间转录组数据库,汇集、整理并分析了14种人类癌症的46个ST数据集(347个子集),数据集来源于5种不同的空间转录组学技术。
数据库网址:http://cancersrt.info/
SPATCH 数据库
SPATCH于2024年发表在预印本上,文献标题《Systematic Benchmarking of High-Throughput Subcellular Spatial Transcriptomics Platforms》,单位为北大曾泽贤团队。
SPATCH,全称 SPAtial Transcriptomics resource for subCellular and High-throughput platforms,是一个空间转录组学资源,专注于亚细胞分辨率和高通量平台的数据集,包括Stereo-seq v3、Visium HD、NanoString 6K、Xenium 5K等,并提供配对的CODEX和单细胞转录组(scRNA-seq)数据作为参考。该数据集首次对最先进的空间转录组学技术进行了基准测试,并提供了大量基因的面板数据。数据库网址:
http://spatch.pku-genomics.org/
转载于:网上最全的空间转录组数据库大汇总,便于大家交流与学习