MEGA3:分子进化遗传学分析和序列比对集成软件
李升伟 摘译
摘要
在分子进化和群体遗传学的理论基础稳固确立后,比较DNA和蛋白质序列分析在重建物种和多基因家族的进化历史、估计分子进化速率以及推断塑造基因和基因组进化的性质和程度方面发挥了核心作用。随着高通量测序技术和新颖的统计及计算方法的发展,这些研究的范围现在已经大大扩展。这些方法需要易于使用的计算机程序。其中一项努力就是开发分子进化遗传学分析(MEGA)软件,其重点在于促进从进化角度对DNA和蛋白质序列变异的探索和分析。目前处于第三个主要版本,MEGA3包含了自动和手动序列比对、基于网络的数据库挖掘、系统发育树的推断、进化距离的估计以及测试进化假设的功能。本文概述了MEGA中用于数据输入的统计方法、计算工具以及可视化探索模块,并介绍了在该软件中可以获得的结果。
引言
大规模基因组测序和个体实验室项目已经从各种生物体中产生了大量的数据。在分子进化遗传学原则指导下进行的比较序列分析,对于利用这些数据构建生命树、推断基因组及物种进化的进化模式,以及阐明各种形态和生理特征的进化机制至关重要。现在对执行这些任务所需软件的需求已经得到了广泛认可。这种软件必须包含快速的计算算法、有用的统计方法,并且拥有广泛且用户友好的界面,以便在序列数据生成前沿工作的实验者能够发现新的模式并探索基本的序列属性。这种需求促使我们在20世纪90年代初开发了MEGA(分子进化遗传学分析软件)。从其诞生之初,我们对MEGA软件的目标就是在一个用户友好的环境中提供广泛的各种统计和计算方法,用于比较序列分析。1993年发布的MEGA的第一个版本被分发给了超过2000名科学家。2001年发布的第二个版本MEGA2是对第一个版本的完全重写,利用了平均桌面计算机计算能力的显著提升以及Microsoft Windows图形界面的可用性。MEGA2的用户友好性和方法论上的进步以及科学界进行的分子进化分析的广度增加导致了全球用户数量的大幅增长。 对引用MEGA的研究论文的调查显示,它已被应用于多个学科,包括艾滋病/艾滋病病毒研究、病毒学、细菌学和一般疾病、植物生物学、保护生物学、系统学、发育进化和群体遗传学。
新发布的MEGA3通过添加序列数据比对和组装功能以及其他进步扩展了MEGA2的功能。现在,序列数据的获取与进化分析有效集成,使得在集成计算环境中进行比较分析变得更加容易。然而,MEGA3并非旨在成为所有进化分析方法目录。相反,它是用于从进化角度探索序列数据、构建系统发育树和测试进化假设的工具,特别是对于由最近基因组项目生成的大规模数据集。以下是对MEGA3的功能和可用设施简要概述。它首先描述了MEGA的最新增补——序列比对和数据组装模块——因为它们构成了任何比较序列分析调查的第一步。接着是描述了MEGA可以分析的不同类型的数据、其图形输入输出数据探索器、动态数据子集功能以及用于推断系统发育树和估计进化距离的统计方法和计算工具。
详见原文:https://academic.oup.com/bib/article/5/2/150/330185?searchresult=1