当前位置：首页 > news >正文

单细胞格式转换 rds 转成 h5ad

news 2025/8/20 14:38:24

单细胞格式转换 rds 转成 h5ad

R
python
- 第一步 Rstudio上Seurat读取并转为loom文件
- 第二步安装loompy模块
- Scanpy 转换为h5ad文件
参考：

R

pbmc <- readRDS(rds_file)
pbmc[["RNA3"]] <- as(object = pbmc[["RNA"]], Class = "Assay")DefaultAssay(pbmc) <- "RNA3"
pbmc[["RNA"]] <- NULL
pbmc <- RenameAssays(object = pbmc, RNA3 = 'RNA')
pbmc[["RNA"]]$scale.data <- NULL # 直接转换会报错，因为版本问题，所以，做上面的转换工作
SaveH5Seurat(pbmc, filename = "pbmc.h5Seurat")Convert("pbmc.h5Seurat", dest = "h5ad")

python

第一步 Rstudio上Seurat读取并转为loom文件


library(Seurat)file <- readRDS('main.rds')main.loom <- as.loom(x = file, filename = "/DATA01/home/usr/data/NS/0624/main.loom", verbose = FALSE)write.csv(main@meta.data,'/DATA01/home/usr/data/NS/0624/mian.csv') #细胞一定要写成csv文件啊，后续就不用再标注细胞啦多方便啊

第二步安装loompy模块

pip install

然后各种pip install --user 以及 pip install -U loompy 后成功

Scanpy 转换为h5ad文件


import scanpy as scimport pandas as pdimport loompyadata = sc.read_loom("/DATA01/home/usr/data/NS/0624/main.loom", sparse=True, cleanup=False, X_name='spliced', obs_names='CellID', var_names='Gene', dtype='float32')obs= pd.read_csv('mian.csv',delimiter=',', index_col=0)adata.obs = obsadata.write('main.h5ad')

这样，文章数据里的细胞信息就能最大程度地保留啦~但是如果细胞数很多的话，比如我引用的这个13万个细胞（虽然我觉得还好。。。），scanpy.read_loom转换成Anndata慢的要死，建议写成脚本扔到后台进行。

ps.开着spyder或者IPython读取loom文件记得关掉。。否则容易引发OS错误，比如我这样。。。

参考：

https://www.jianshu.com/p/8621088e1647
https://www.jianshu.com/p/2b5af1648eac

http://www.dtcms.com/a/340040.html

相关文章：

transformer模型初理解

Transformer、BERT、BEiT等模型相关八股及代码【自用】

HJ4 字符串分隔

神经网络训练过程详解

电流采样实现方法

JavaScript 代码保护与混淆

Vue2+Vue3前端开发_Day1

端口映射原理操作详解教程：实现外网访问内网服务，本地路由器端口映射公网ip和软件端口映射域名2种方法

Qwen2.5-vl源码解读系列：LLM的Embedding层

MySQL常用函数

首届机器人足球运动会技术复盘：从赛场表现看智能机器人核心技术突破

Wireshark获取数据传输的码元速率

中科米堆CASAIM提供机加工件来料自动化测量尺寸方案

Origin绘制气泡图｜科研论文图表教程（附数据格式模板）

【HarmonyOS】H5 实现在浏览器中正常跳转 AppLinking 至应用

Java基础 8.19

基于SpringBoot的停车场管理系统【2026最新】

C文件/Linux内核级文件理解

软考网工选择题-1

路由器详解

Windows 8.1 补丁 KB2919355 安装方法详细步骤

【Netty4核心原理⑫】【异步处理双子星 Future 与 Promise】

【AI】算法环境-显卡、GPU、Cuda、NVCC和cuDNN的区别与联系

Stimulsoft 发布 2025.3 版本：支持在报表计算中解释运行 C# 脚本

Apache ShenYu网关与Nacos的关联及如何配合使用

基于Envoy的AI Gateway测试环境搭建

基于决策树模型的汽车价格预测分析

DAY 50 预训练模型+CBAM模块

CiA402 伺服驱动标准与控制模式详解

STL——string的使用(快速入门详细）