2024.06.04【读书笔记】丨生物信息学与功能基因组学(第十章 多序列比对的基本概念与应用 第四部分)【AI测试版】
读书笔记:《生物信息学与功能基因组学》第十章(第四部分)
标题:多序列比对的实际操作与案例分析
实际操作案例
- ClustalW和ClustalX:介绍了如何使用ClustalW进行网络多重比对,以及ClustalX的视窗界面操作。通过FASTA格式提交序列,使用“DoCompleteAlignment”命令产生多重比对,并可进一步手工编辑。
- PileUp (GCG):使用GCG包中的PileUp程序进行多重比对,允许调整空白罚分和延伸罚分,以及改变序列排列顺序。
多序列比对软件概览
- Dialign:适用于局部比对。
- MultAlin:位于法国Toulouse的INRA。
- Multiple Sequence Alignment version 2.0:位于GeneStream服务器。
- Musca:IBM的生物信息学小组开发。
- T-COFFEE:处理远缘蛋白时比ClustalW稍慢。
多重比对算法评估
- BAliBASE:作为参考比对数据库,用于评估多重比对程序的准确性。
- 序列一致性:当序列一致性低于25%时,比对准确度显著下降。
多重比对中的错误
- 假阴性:忽略了真正的同源序列。
- 假阳性:错误地加入了不可靠的家族成员。
- 比对错误:无法正确匹配远缘成员或不恰当地加入空白。
网络资源
- 提供了多个网络工具和数据库,如AMAS、CINEMA、DIALIGN、Match-Box Web、MultAlin等,用于多序列比对分析。
结论
多序列比对是生物信息学中的一个关键技术,它允许研究者探索蛋白质家族的进化关系和功能特性。通过使用不同的软件和数据库,研究者可以对蛋白质序列进行精确的比对和分析。了解这些工具的优缺点,以及如何根据特定需求选择适当的比对策略,对于有效地进行多序列比对至关重要。
我创建了一个生信行业交流群,有兴趣的小伙伴可以加v bbplayer2021,或者后台私信,大家共同进步