当前位置：首页 > news >正文

玉米籽粒品质相关性状的GWAS和Meta-QTL分析

news 2025/10/16 23:27:38

在这里插入图片描述
https://www.mdpi.com/2223-7747/13/19/2730

4. 材料和方法

4.1. 材料和实验设计

本研究分析了中国北京市农业科学院提供的 368 种材料中的 260 个玉米自交系，这些玉米自交系表现出优异的适应性。2020 年，位于中国甘肃省武威市黄阳实验站（北纬 37.97°，东经 102.63°）的玉米育种试验田被用于种植。实现了一个完全随机的区组设计，由三个重复组成。每个玉米自交系种植成两行，每行长 4 m，株距 0.25 m，行距 0.4 m。田间管理实践符合当地农业生产标准。

4.2. 表型性状的确定

收获后，测量与籽粒相关的品质性状。使用 NIRS DA 1650™ （Foss， Hilleroed， Denmark）测量玉米粒的蛋白质含量（PC）、油含量（OC）和淀粉含量（SC）。所有结果均以干基（%）报告，每个样品重复 3 次，平均值用于统计分析。

4.3. 表型数据分析

使用 IBM SPSS Statistics 21 和 Origin 2022 软件对表型数据进行描述性统计分析和相关性分析，并生成相应的图表。

4.4. 全基因组关联研究

对分布在整个玉米基因组中的 558,529 个 SNP 位点进行全基因组关联分析，最小等位基因频率为 ≥0.05。基因型数据可在网站上访问（http://www.Maizego.org/Resources.html，2024 年 6 月 1 日访问）[10]。对基因进行质量控制，并使用 Tassel 5.0 软件中的混合线性模型（MLM）方法进行 GWAS 分析。根据其分位数-分位数（QQ）散点图选择最佳模型，对每个性状进行 GWAS 分析。Bonferroni 阈值是使用 R 语言确定的，显着性阈值设置为 p = 1 × 10−5用于识别重要的 SNP。QQ 图是使用 R 中的“CMplot”包生成的。

4.5. 候选基因挖掘和功能分析

以前的研究人员利用大约 560,000 个 SNP 来评估该组内连锁不平衡（LD）衰减的程度，揭示了相关组的 LD 衰减距离为 50 kb （R2= 0.1）。因此，本研究采用该衰减距离作为总体的 LD 衰减距离。这是基于玉米 B73 基因组序列的上游和下游显著相关的 SNP 标记的物理位置，RefGen_v3总跨度为 100 kb。利用 NCBI （https://www.ncbi.nlm.nih.gov/）和 MaizeGDB （https://www.maizegdb.org/）的资源，我们搜索了与每个性状相关的所有候选基因，并根据其功能注释选择了最合适的基因作为候选基因。来自各种玉米组织的转录组数据从 qTeller 网站下载（https://qteller.maizegdb.org/，2024 年 6 月 1 日访问）。这个全面的数据集包括28个组织和发育阶段[40]，如胚胎（16、18、20、22、24 DAP）、胚乳（12、16、18、20、22、24 DAP）、全种子（2、4、6、8、10、12、14、18、20、22、24 DAP）、花药（R1）、玉米棒（R1、V18）、蚕丝（R1）和穗原基（2-4 mm和6-8 mm）。该数据集有助于对候选基因进行组织特异性表达分析。

4.6. 玉米品质性状相关 QTL 信息的集合

本研究利用 Web of Science （http://www.webofknowledge.com/）和中国国家知识基础设施（https://www.cnki.net/）收集有关玉米品质性状相关数量性状位点（QTL）的信息。于 2024 年 6 月 1 日访问，使用 “玉米”、“质量”、“淀粉”、“油”、“蛋白质”、“QTL” 和 “高密度遗传图谱” 等关键词进行搜索，确定了 2005 年至 2024 年间发表的 20 多篇相关文献。选择提供 QTL 区间和侧翼标记的文章进行编译（表 S8）。对于具有全面遗传图谱和 QTL 信息的实验，根据软件的格式化要求对数据进行组织。这包括所有基本参数，例如 QTL 名称、位置、性状、连锁组、LOD（赔率似然）值、置信区间（CI）和解释的表型方差（R2).此外，从 MaizeGDB 网站（https://maizegdb.org/data_center/map?id=1140201,2024 年 6 月 1 日访问）下载了 IBM2 2008 Neighbors 地图中的信息，作为统一的遗传和参考地图。

4.7. QTL 信息的整合

使用 BioMercator 4.2.3 软件进行 QTL 预测和荟萃分析 [41]。置信区间（CI）和 R2的 QTL 是两个关键参数。QTL 的 Meta 分析主要依赖于 QTL LOD 评分 R2、position 和 CI 一起。在收集的QTL数据缺乏95%置信区间的情况下，根据Darvasi和Soller [42]提供的公式进行推断，其中N代表原始作图群体的大小。
CI = 530/（N × R2) (1)
CI = 163/（N × R2) (2)
公式（1）适用于回交和 F2映射群体，而公式（2）适用于 RIL 映射群体。

4.8. QTL 预测和荟萃分析

应通过遗传数据加载上传完整的遗传图谱和收集的 QTL 信息，然后将 QTL 映射到参考图谱。IBM2 Neighbors 的遗传连锁图谱整合了玉米高密度分子标记连锁图谱（Intermated B73 × Mo17 Map;IBM）和其他分子标记物连锁图谱。这张综合图谱包括 19,111 个基因座，其中包括 RFLP、SSR 和 RAPD 标记，以及基因和序列探针，总长度为 7898.35 cM（来源：https://maizegdb.org/data_center/map，2024 年 6 月 10 日访问;最后更新于 2022 年 8 月 10 日，由 Marty Sacks 提供）。对每条染色体上存在的 QTL 簇进行 MQTL 分析。在该分析中，采用各种标准——AIC （Akaike 信息标准）、AICc （AIC 校正）、AIC3 （AIC3 候选模型）、BIC （贝叶斯信息标准）和 AWE （证据平均权重）——来评估所有潜在的 QTL 组合。表现出最低 AIC 值的模型表明存在多个 QTL，用于元 QTL 分析的初始 QTL 数量至少设置为 3 [43]。此外，计算 95% QTL 的位置和置信区间（CI），并从 MaizeGDB 中鉴定 QTL 的侧翼标记。从软件获得 MQTL 结果后，使用 MaizeGDB 确定 2008 年 IBM2 邻居的 B73 （AGPv 3）上相应标记的物理位置。最后，还从 MaizeGDB 中检索到与鉴定的 QTL 相关的候选基因。

在这里插入图片描述