meta|BioMercator:整合遗传图谱和 QTL 以发现候选基因
摘要:
总结:育种计划面临着将基因组学信息和数量性状位点(QTL)分析结果整合起来的挑战,以便识别控制重要性状变异的基因组序列。尽管已经开发了综合数据库,但从多个图谱中收集的基因、QTL和其他位点构建共识图谱仍然是一个手动且繁琐的任务。然而,这是揭示基因和QTL之间共定位的关键步骤。另一个重要问题是确定是否在独立实验中检测到的与相同性状或相关性状相关的QTL是否位于同一区域,并且是否代表一个单一的位点。统计工具(如元分析)可以用来回答这个问题。BioMercator已被开发用于自动化图谱编译和QTL元分析,并通过图形界面可视化基因和QTL之间的共定位。
可用性:根据请求提供(http://moulon/~bioinfo/BioMercator/)。学术使用免费。
联系:joets@moulon.inra.fr
引言
发现涉及数量性状变异的基因是理解这些性状背后生物学过程的第一步。一种有前景的方法是利用共识遗传图谱揭示基因组中与性状变异相关的区域(即数量性状位点或QTL)和候选基因之间的共定位(Flint和Mott,2001)。构建共识图谱必须基于许多个体图谱中的信息性位点。有价值的软件如CarthaGene(http://www.inra.fr/bia/T/CarthaGene/)或JoinMap(Stam,1993)可用于从多个群体的原始分离数据构建合成图谱。不幸的是,原始数据很少通过文献或数据库获得。相反,位点位置值总是被描述,并且可以用来通过一种相似投影过程合并遗传图谱。事实上,如果两个遗传图谱有足够数量的共同位点,这些位点可以被视为连接图谱的桥梁。因此,从第一张图谱到其他图谱投影剩余的位点,包括QTL,是可能的。最后,可以通过迭代投影从多个图谱中构建一个编译图。
当检测到QTL时,它被描述为连锁群上的最可能位置以及围绕该位置的置信区间。不幸的是,置信区间的长度可能代表数十个厘摩(cM),而植物基因组中的基因密度通常在每cM 30到50个基因之间(Sasaki等人,2002;Feng等人,2002;拟南芥基因组计划,2000)。因此,一个QTL可能对应于许多候选基因。另一方面,在独立实验中检测到的位于染色体某一区域的QTL可能代表一个单一QTL位置的多个估计值。可以通过适当的统计工具(如元分析)来测试这一假设,元分析有助于将来自不同来源的数据合并到单一研究中。Goffinet和Gerber(2000)开发了一种适用于QTL数据的元分析方法。这种方法表明,在独立实验的QTL池中潜在的“真实”QTL的最可能数量,并为这些QTL提供共识位置。在大多数情况下,与初始QTL的最小置信区间相比,共识位置的置信区间长度有所减少。这减少了匹配基因的数量,因此有助于识别相关的候选基因。
我们开发了 BioMercator,旨在(1)为用户提供地图显示工具,(2)自动化地图编译,以及(3)计算 QTL 元分析。
BioMercator 适用于参与任何生物体 QTL 定位项目的科学家。
程序概述
遗传图谱投影算法
目的是将QTL、基因和其他位点从一张遗传图谱投影到另一张图谱上,以便将所有信息汇总到一张独特的图谱上。这种计算仅基于位点位置数据。每个要加载到BioMercator中的遗传图谱都由用户创建的文本文件描述。描述QTL(性状名称、LOD分数、R²)的数据从第二个文件中加载,用于图形显示的目的。要投影的图谱和投影参数在对话框窗口中选择。对于每对同源染色体,列出共享相同名称的共同位点。然后为每两个共同位点之间的每个区间计算特定的距离比率。可以自动从共同位点列表中丢弃位置颠倒的位点对。最后,通过相似投影过程应用适当的距离比率,计算目标图谱上QTL和/或剩余位点的位置。鼓励用户审查结果图谱,因为其相关性未由软件评估。在迭代投影的情况下,特别需要谨慎设计图谱的顺序。为了限制误差传播,投影过程应从显示位点顺序质量最高的图谱开始。该软件已成功用于将超过5000个位点从公共图谱投影到我们当前工作的玉米图谱上。
元分析算法
Goffinet和Gerber(2000)设计的算法可以帮助确定在染色体同一区域内从独立实验中检测到的N-QTL是否与1-、2-、3-、4-或N-QTL模型一致(N-QTL模型是输入QTL数量与“真实”QTL数量相等的情况)。对于这五种模型中的每一种,都通过最大似然法确定最可能的QTL分布。然后,一种类似Akaike的统计标准指示五种模型中的最佳模型。元分析计算基于QTL的位置以及该位置的方差,该方差通过置信区间值评估[从LOD曲线推导而来,或从群体大小和QTL解释的方差比例(Darvasi和Soller,1997)得出]。QTL数据集应包括10-40个QTL,这些QTL位于不超过200 cM的基因组区域内。图形用户界面用于构建要包含在元分析实验中的QTL集合,并显示每个元分析模型的共识QTL位置以及统计结果。
图形用户界面
除了上述描述的功能外,BioMercator界面还提供了许多显示选项:可以对图谱中的每条染色体进行缩放,遗传单位的可调节比例尺,以及将图谱显示导出为JPEG图像格式。可以加载并选择多个地图文件进行图形显示(见图1)。BioMercator可以在支持Java 1.4的Windows、Unix、MacOS X和Linux平台上运行。