深入了解 gmx_RRCS:计算原理、操作步骤及输出文件解析
前段时间,我写了一篇介绍gmx_RRCS的推文,之后有不少人希望我能再出一个更详细的版本,尤其是对gmx_RRCS输出文件含义进行解读。大家的反馈我都看到了,所以准备再写一篇,仔细讲讲输出文件里各项内容是什么意思,方便大家使用gmx_RRCS。
RRCS计算原理
RRCS 通过对每一对残基间所有可能的重原子对进行求和来量化残基对之间的接触强度。对于相邻残基(在蛋白质序列中相距四个氨基酸以内),只考虑侧链重原子对,排除涉及主链原子(Ca、C、O、N)的原子对;对于其他残基对,则考虑所有可能的重原子对(包括主链原子)。其计算公式采用自 GPCR–CoINPocket 的高原-线性-高原形式的原子接触分数进行求和。
优势
与布尔描述符(如接触图和残基接触等)相比,RRCS 能更精确地描述残基间接触情况。布尔描述符无法捕捉侧链重排以及涉及相邻残基的局部接触变化,而 RRCS 的变化能很好地体现这些情况,可系统地量化全局、局部、主要和细微的构象变化,包括螺旋间和螺旋内的变化,以及接触的切换和重新排列。
配图:残基接触(RC)(Venkatakrishnan等人,2016)和 残基残基接触评分(RRCS)的计算比较。RRCS可以更准确地定量描述残基-残基接触的强度,比布尔描述符RC更方便。
若想更全面了解RRCS理论及在蛋白质结构分析中的关键应用,可以阅读下方文献:
gmx_RRCS使用详解
1. 安装
conda create -n py39 python=3.9
conda activate py39
pip install gmx-RRCS
2. 运行
示例文件链接:
https://github.com/RuijinHospitalRCMSB/gmx_RRCS/tree/main/examples
当然你也可以后台回复关键词 “250511” 获取。
gmx_RRCS --top_file md0.pdb --traj_file md0.xtc --res_file SpecifyResidues.txt
SpecifyResidues.txt
是参数文件,里面的内容填写格式以及含义我已经在上一篇文章中详细介绍过了,有需要的可以点击下图跳转:
图片跳转链接
3. 输出文件
最终的输出结果是txt文件,打开后里面的内容如下图所示:
每一列含义解释:
-
•
Frame
:该列数据代表 GROMACS 模拟轨迹中的帧索引,反映模拟过程中的不同时间点或状态,用于追踪和区分不同时刻下残基对的 RRCS 变化情况,方便研究人员观察模拟进程中残基对接触分数随时间的动态变化 。 -
•
Residue1
:此列记录参与 RRCS 计算的第一个残基的标识符,用于明确在计算残基-残基接触分数时其中一个残基的身份,通过该标识符可确定具体是哪个残基参与了与其他残基的接触分数计算 。 -
•
Residue2
:该列列出参与 RRCS 计算的第二个残基的标识符,结合 “Residue1” 列,能精准定位计算 RRCS 的残基对,了解特定残基对之间的相互作用情况 。 -
•
RRCS
:展示对应残基对的 RRCS 计算得分,这个分数量化了残基对之间的接触强度,数值大小反映了两个残基之间接触的紧密程度,是研究蛋白质结构中残基相互作用的关键指标。
为了方便地拷贝数据到绘图软件,我们将此输出文件转为表格文件:
grep -v '^#' RRCS_output.txt | sed 's/ \+/,/g' > RRCS_output.csv
打开输出的RRCS_output.csv
文件,如下图所示。这样就可以很方便地拷贝数据到其他绘图工具中了。