当前位置：首页 > news >正文

tRAP（tRNA 活性预测器）

news 2025/8/15 19:24:23

tRAP（tRNA 活性预测器）

29 种胎盘哺乳动物物种的预测结果已上线！点击访问

本程序仅依靠 DNA 序列即可对 tRNA 基因表达进行二元（活性/非活性）分类预测。相关论文请见：https://genome.cshlp.org/content/30/1/85。

程序最初围绕“从 HAL 对象到 tRNA 分类”这一思路构建。然而，许多实验室使用 MAF 而非 HAL，或者已经将 HAL 降维成其他格式。为此，整个流程提供了若干中间文件，可按顺序使用；如果您已经拥有某一步生成的文件，可直接跳过该步骤。

当您准备运行最终分类脚本时，应确保手头有以下文件：

.wig 文件：包含每个 tRNA 基因上游 20 bp 至下游 10 bp 区间所有碱基的 PhyloP 得分
.bed 文件：记录各 tRNA 基因的坐标（由 tRNAscan-SE 产生）
.out 文件：记录各 tRNA 基因的 bit-score（由 tRNAscan-SE 产生）
.fa 文件：包含每个 tRNA 基因上下游各 350 bp 的 DNA 序列（若染色体末端不足 350 bp 则以末端为准）
RNAfold 输出：给出每个 tRNA 基因的最低自由能（MFE）
.bed 文件：包含目标基因组中已注释蛋白编码基因的位置

若要从头到尾完整运行，需安装：scikit-learn、RNAfold、tRNAscan-SE、HAL 与 PHAST。HAL 与 PHAST 的详细安装说明见：https://github.com/ComparativeGenomicsToolkit/hal（大多数系统通用）。

tRNAscan-SE 下载：http://lowelab.ucsc.edu/tRNAscan-SE/
必要数据可直接从 http://gtrnadb.ucsc.edu 下载
RNAfold：https://github.com/ViennaRNA/ViennaRNA
scikit-learn：conda install scikit-learn 或 pip install scikit-learn

通用用法

在 Cactus 尚未普及之前，大多数用户可能希望仅凭一条基因组序列就快速获得分类结果。该“简化版”几乎与完整 Cactus 版同样准确，却更简洁、更快速且稳健。为此，我们提供了 Snakefile（Snakemake 教程见这里）。使用 Snakefile 前，请先运行 tRNAscan-SE 与 EukHighConfidenceFilter（或直接从 gtrnadb.ucsc.edu 下载结果），并确保工作目录包含以下按固定命名规则命名的文件：

{root_name}.fa（完整基因组，FASTA 格式）
{root_name}.chrom.sizes（多数物种可从 https://hgdownload.soe.ucsc.edu/goldenPath/ 下载）
{root_name}-tRNAs.bed（tRNAscan-SE 输出）
{root_name}-tRNAs-confidence-set.out（tRNAscan-SE 输出）
{root_name}-tRNAs-confidence-set.ss（tRNAscan-SE 输出）

然后执行：

snakemake {root_name}tRNAScores.txt

更多细节见简化版一节。

分步指南

以下按顺序给出完整指南。所有以 .py 结尾的命令为本仓库提供的脚本，其余为 HAL、PHAST 或 tRNAscan-SE 自带功能。

1 从 HAL 比对中提取目标物种基因组

hal2fasta /path/to/hal-file species-name > genome.fa

2 使用 tRNAscan-SE 2.0 查找并注释 tRNA 基因，同时过滤假基因与低置信度基因

tRNAscan-SE genome.fa \-o tRNA.out \-f tRNA.ss

查看全文

http://www.dtcms.com/a/328795.html

Java开发主流框架搭配详解及学习路线指南

二叉树的最小深度

Android 终端接入 GB28181 国标视频平台的完整解决方案解析

【安卓，问题记录】ImageView 在布局顺序上位于 Button 上方，却出现图像内容被 Button 遮挡

AIOPS人才需具备的技术需求

【完整源码+数据集+部署教程】火柴实例分割系统源码和数据集：改进yolo11-rmt

latex中“itemize”

如何写出高质量的dify参数提取器prompt

【P21】OpenCV Python——RGB和BGR，HSV和HSL颜色空间，及VScode中报错问题解决

vscode扩展应用 -koroFileHeader（jsdoc代码风格注释）

.net\c#web、小程序、安卓开发之基于asp.net家用汽车销售管理系统的设计与实现

InnoDB如何解决脏读、不可重复读和幻读的？

天文与航天领域专业计算库介绍

C# 反射入门：如何获取 Type 对象？

Blender模拟结构光3D Scanner（一）外参数匹配

决策树回归：用“分而治之”的智慧，搞定非线性回归难题（附3D可视化）

JS 与 C++ 双向通信实战：基于 WebHostViewListener 的消息处理机制

Java后端面试题（含Dubbo、MQ、分布式、并发、算法）

分布式与微服务宝典

智能算法流程图在临床工作中的编程视角系统分析

【docker①】在VS Code中使用Docker容器

安全点（Safepoint）完成后唤醒暂停线程的过程

解决uni-app微信小程序编译报错：unexpected character `1`

机器学习实战·第三章分类（2）

EI学术会议 | 虚拟现实、图像和信号处理

股指期货长线还是短线好？

AWS Redis Serverless连接完全指南：从安装到实战

Notepad++插件开发实战：从入门到精通

oss(阿里云)前端直传

使用 Milvus Operator 在 Kubernetes 中部署 Milvus记录