当前位置: 首页 > news >正文

单细胞格式转换 rds 转成 h5ad

单细胞格式转换 rds 转成 h5ad

  • R
  • python
    • 第一步 Rstudio上Seurat读取并转为loom文件
    • 第二步 安装loompy模块
    • Scanpy 转换为h5ad文件
  • 参考:

R

pbmc <- readRDS(rds_file)
pbmc[["RNA3"]] <- as(object = pbmc[["RNA"]], Class = "Assay")DefaultAssay(pbmc) <- "RNA3"
pbmc[["RNA"]] <- NULL
pbmc <- RenameAssays(object = pbmc, RNA3 = 'RNA')
pbmc[["RNA"]]$scale.data <- NULL # 直接转换会报错,因为版本问题,所以,做上面的转换工作
SaveH5Seurat(pbmc, filename = "pbmc.h5Seurat")Convert("pbmc.h5Seurat", dest = "h5ad")

python

第一步 Rstudio上Seurat读取并转为loom文件


library(Seurat)file <- readRDS('main.rds')main.loom <- as.loom(x = file, filename = "/DATA01/home/usr/data/NS/0624/main.loom", verbose = FALSE)write.csv(main@meta.data,'/DATA01/home/usr/data/NS/0624/mian.csv') #细胞一定要写成csv文件啊,后续就不用再标注细胞啦多方便啊

第二步 安装loompy模块

pip install

然后各种pip install --user 以及 pip install -U loompy 后成功

Scanpy 转换为h5ad文件


import scanpy as scimport pandas as pdimport loompyadata = sc.read_loom("/DATA01/home/usr/data/NS/0624/main.loom", sparse=True, cleanup=False, X_name='spliced', obs_names='CellID', var_names='Gene', dtype='float32')obs= pd.read_csv('mian.csv',delimiter=',', index_col=0)adata.obs = obsadata.write('main.h5ad')

这样,文章数据里的细胞信息就能最大程度地保留啦~但是如果细胞数很多的话,比如我引用的这个13万个细胞(虽然我觉得还好。。。),scanpy.read_loom转换成Anndata慢的要死,建议写成脚本扔到后台进行。

ps.开着spyder或者IPython读取loom文件记得关掉。。否则容易引发OS错误,比如我这样。。。

参考:

https://www.jianshu.com/p/8621088e1647
https://www.jianshu.com/p/2b5af1648eac

http://www.dtcms.com/a/340040.html

相关文章:

  • transformer模型初理解
  • Transformer、BERT、BEiT等模型相关八股及代码【自用】
  • HJ4 字符串分隔
  • 神经网络训练过程详解
  • 电流采样实现方法
  • JavaScript 代码保护与混淆
  • Vue2+Vue3前端开发_Day1
  • 端口映射原理操作详解教程:实现外网访问内网服务,本地路由器端口映射公网ip和软件端口映射域名2种方法
  • Qwen2.5-vl源码解读系列:LLM的Embedding层
  • MySQL常用函数
  • 首届机器人足球运动会技术复盘:从赛场表现看智能机器人核心技术突破
  • Wireshark获取数据传输的码元速率
  • 中科米堆CASAIM提供机加工件来料自动化测量尺寸方案
  • Origin绘制气泡图|科研论文图表教程(附数据格式模板)
  • 【HarmonyOS】H5 实现在浏览器中正常跳转 AppLinking 至应用
  • Java基础 8.19
  • 基于SpringBoot的停车场管理系统【2026最新】
  • C文件/Linux内核级文件理解
  • 软考网工选择题-1
  • 路由器详解
  • Windows 8.1 补丁 KB2919355 安装方法 详细步骤
  • 【Netty4核心原理⑫】【异步处理双子星 Future 与 Promise】
  • 【AI】算法环境-显卡、GPU、Cuda、NVCC和cuDNN的区别与联系
  • Stimulsoft 发布 2025.3 版本:支持在报表计算中解释运行 C# 脚本
  • Apache ShenYu网关与Nacos的关联及如何配合使用
  • 基于Envoy的AI Gateway测试环境搭建
  • 基于决策树模型的汽车价格预测分析
  • DAY 50 预训练模型+CBAM模块
  • CiA402 伺服驱动标准与控制模式详解
  • STL——string的使用(快速入门详细)