当前位置: 首页 > news >正文

无油樟(Amborella trichopoda)T2T基因组--文献精读165

Near-gapless telomere-to-telomere reference nuclear genome and variable mitochondrial genome of Amborella trichopoda

无油樟(Amborella trichopoda,无油樟科,以下简称 “无油樟”)(图 1A)是一种灌木,为西南太平洋新喀里多尼亚岛特有物种,是所有其他现存被子植物的唯一姊妹类群(Qiu 等,1999;千种植物转录组计划,2019)。因其独特的系统发育地位,无油樟一直是植物学家的研究热点。2013 年,无油樟的核基因组与线粒体基因组首次发布,尽管组装结果存在大量片段化问题,但仍为基因组与基因家族进化、系统发育基因组学及花发育研究提供了宝贵资源(无油樟基因组计划,2013;Rice 等,2013)。2024 年,单倍型解析的无油樟基因组组装完成,组装质量与完整性均得到显著提升(Carey 等,2024)。

图 1 无油樟核基因组与线粒体基因组的组装及特征A:无油樟的形态特征;B:无油樟核基因组的特征,其中 Ⅰ 为基因密度,Ⅱ 为所有转座元件(TE)密度,Ⅲ 为所有 DTM 类末端反向重复序列(TIR)密度,Ⅳ 为所有 Copia 类长末端重复反转录转座子(LTR-RT)密度,Ⅴ 为所有 Gypsy 类 LTR-RT 密度,Ⅵ 为 GC 含量柱状图;外圆粗灰色线段代表 13 条染色体的坐标(Mb);C:无油樟核基因组的端粒与着丝粒;D:17 种植物基因组中各类 TE 的占比;E:无油樟线粒体基因组组装结果对比,其中 KF 代表 Rice 等(2013)的前期组装结果,AT 代表本研究的新组装结果。图中缩写:mt(线粒体)、TE(转座元件)、TIR(末端反向重复序列)、LTR(长末端重复序列)、RT(反转录酶)、GC(鸟嘌呤 - 胞嘧啶含量)、HGT(水平基因转移)。

随着测序技术与基因组组装算法的发展,许多植物已实现高质量甚至无缺口的端粒 - 端粒(T2T)基因组组装(Chen 等,2023)。本研究通过整合约 90 Gb(约 100× 覆盖度)的 PacBio HiFi 读长与 14 Gb(约 15× 覆盖度)的 Illumina 短读长数据(表 S1),完成了无油樟近无缺口的 T2T 基因组组装(杂合率 = 0.36%,图 S1)。组装流程如下:

  1. 首先获得 710 Mb 的基因组组装结果,包含 34 个 contig(contig N50=44.37 Mb);
  2. 以近期发布的无油樟基因组(Carey 等,2024)为参考,将 26 个 contig 进一步合并为 13 条对应假染色体(scaffold N50=54 Mb)(图 1B、图 S1),仅残留 13 个缺口(图 S1);剩余 8 个 contig 经鉴定为线粒体基因组片段(7 个)或叶绿体基因组片段(1 个)。

在 13 条假染色体中,5 条实现无缺口染色体水平完整组装,5 条各含 1 个缺口,1 条含 2 个缺口,其余 2 条各含 3 个缺口(图 S2)。对这 13 条假染色体的分析显示,其两端的 26 个端粒(序列为 AAACCCTn)与 13 个着丝粒均已鉴定(图 1C):端粒平均长度为 13.1 Kb,范围 3.1-39.2 Kb(表 S2);着丝粒平均长度为 1337.0 Kb,范围 114.4-3778.0 Kb(表 S3)。与已发布的无油樟基因组组装结果相比,本研究组装的基因组与其他版本具有一致的共线性(图 S3),但在连续性与完整性上显著提升(表 S1)。

无油樟核基因组的完整性与质量评估

采用多种方法评估无油樟核基因组的完整性与质量:

  • Illumina 短读长与 HiFi 读长的比对率均超过 99%;
  • 通过单拷贝直系同源基因基准评估(BUSCO),组装结果与注释结果分别捕获 97.8% 和 96.9% 的完整 BUSCO 基因(表 S4、表 S5);
  • 整合从头预测、同源比对与转录组辅助注释的基因结构注释(表 S6)共预测出 27583 个蛋白质编码基因,数量多于此前研究(无油樟基因组计划,2013;Carey 等,2024)(表 S1)。

基因家族聚类分析

选取 70 个已发布的植物基因组(表 S7)(涵盖藻类、苔藓植物、石松类 + 蕨类、裸子植物、被子植物等主要植物类群)进行基因家族聚类分析。本研究将 “核心基因家族” 定义为某一类群中至少 90% 物种共有的基因家族,结果显示:所有受测植物共分享 1780 个基因家族,即所有植物的核心基因家族;不同类群也拥有各自特有的核心基因家族,其中受测被子植物共分享 144 个核心基因家族 —— 这些基因家族可能与被子植物的形态及生理特征(如花、果实)相关。值得注意的是,144 个被子植物核心基因家族中有 132 个在无油樟中存在(图 S4),表明被子植物核心基因家族绝大多数起源于所有现存被子植物的共同祖先。功能注释显示,这些核心基因家族在 “黄酮生物合成过程”“色素生物合成过程”“色素生物合成过程”“作用于成对供体的氧化还原酶活性” 等功能类别中显著富集(图 S5),这一结果揭示了植物进化中遗传物质的创新性。

转座元件(TE)分析

基因组注释显示,450 Mb(占比 63.50%)的序列被注释为转座元件(TE)(表 S7)。通常,长末端重复反转录转座子(LTR-RT)占植物基因组的比例超过 50%,这一趋势在多数已组装植物基因组中均有报道(Zhou 等,2021)。然而,无油樟基因组中最丰富的 TE 并非 LTR-RT,而是 DNA 转座子(Ⅱ 类转座子)的末端反向重复序列(TIR),占基因组的 28.10%。无油樟中这种异常高的 TIR 占比是其与其他植物基因组的显著区别(图 1D),值得进一步研究。

本研究在无油樟中鉴定出 617968 个 TIR,这些 TIR 可进一步分为 5 个主要超家族:Mutator(占比 14.77%,简称 DTM)、hAT(占比 4.41%,简称 DTA)、CACTA(占比 4.66%,简称 DTC)、PIF_Harbinger(占比 2.66%,简称 DTH)和 Tc1_Mariner(占比 1.60%,简称 DTT)。同时,无油樟中 LTR-RT 的积累量相对较低:完整 LTR-RT 1760 个(I)、 solo-LTR(单独存在的 LTR 序列)10712 个(S)、截短 LTR-RT 1331 个(T),仅占基因组的 21.46%;且 LTR-RT 的移除率较高(S:I 比值大于 6 的 LTR 簇占比高),这可能是导致其 LTR-RT 占比低的原因。

多项研究表明,无油樟基因组未经历全基因组复制(WGD)(无油樟基因组计划,2013;千种植物转录组计划,2019),但其基因组大小超过 700 Mb。另一种同样未经历 WGD 的被子植物 —— 流苏马兜铃(Aristolochia fimbriata)的基因组仅为 258 Mb(Qin 等,2021),由此推测,无油樟基因组的扩张主要源于 TIR(尤其是 DTM 类)的积累。

无油樟线粒体基因组分析

此前有研究报道,无油樟线粒体基因组由 5 个线性分子组成,且包含通过水平转移(HT)获得的两个完整外源线粒体基因组(Rice 等,2013),这一结论既引发关注也存在争议。本研究新组装的无油樟线粒体基因组包含 7 个 contig(图 S6),在大小、结构、基因含量与基因顺序上与前期组装结果基本一致,仅存在少量细微差异:尽管组装长度略有不同,但两个版本的同源性易被识别。在 7 个新组装的线粒体 contig 中,最大的线性分子为 Mt3(1519.8 Kb),其次为 Mt1(1252.9 Kb),这两个 contig 与 Rice 等(2013)前期组装结果中最大的 contig(KF03)同源。

前期研究中疑似通过水平转移获得的苔藓与藻类线粒体基因组片段,以及其他被子植物的线粒体基因组片段,均定位于本研究组装结果中两个最大的 contig 上,且与前期组装结果具有良好的共线性,表明这些水平转移片段真实存在,并非污染所致。

尽管两个组装版本均来自无油樟这一物种,但比较分析显示,二者存在明显变异(包括倒位、易位、重复与单核苷酸多态性 SNP),表明差异显著:SNP 可能源于个体特异性位点突变,而倒位与易位则更可能与重复序列相关 —— 重复序列被认为是通过重组驱动植物线粒体基因组结构变异的关键因素(Wu 等,2022;Xue 等,2022)。巧合的是,本研究发现,与前期组装结果相比,新组装结果中发生倒位或易位的区域两侧均存在明显的重复序列(图 1E)。这些观察结果与 “植物线粒体基因组处于不同结构的动态平衡中(即主环与多个亚环甚至线性染色体之间的平衡)” 的假说一致(Wu 等,2022)。

总结

本研究完成了无油樟近无缺口的 T2T 基因组组装,其完整性高于此前所有版本。该组装结果将成为研究被子植物起源、解析重要器官(如花、果实)形态发生机制的宝贵资源。尽管无油樟未经历全基因组复制,但其基因组较大的原因及基因组中异常高占比的元件,均源于 TIR 的扩张。新组装的无油樟线粒体基因组在结构、基因含量与基因顺序上与前期版本存在差异,这一结果支持 “植物线粒体基因组具有动态性,其结构变异可能由重复序列驱动的重组导致” 的假说。

http://www.dtcms.com/a/467410.html

相关文章:

  • 做农业需关注什么网站wordpress主题谁的最好
  • 100m做电影网站网站项目团队介绍怎么写
  • 商城网站jq楼层响应动画师工资一般多少
  • 中企业网站建设免费素材网站 可商用
  • 网站建立于网页设计wordpress留学主题
  • 织梦猫html5高端网络服务机构网站模板上传文件生成链接下载
  • 舆情处置的智能化进阶:Infoseek舆情系统如何构建企业数字免疫体系
  • 手机如何制作一个网站html制作个人简历
  • AI大事记11:从 AlphaGo 到 AlphaGo Zero(上)
  • 有关于网站开发的参考文献网络推广怎么学
  • 【展厅多媒体】解析互动滑轨屏推动数字展厅智能化升级
  • 开源门户网站cmswordpress主题放哪
  • 谷歌推广网站做网站设计都需要什么软件
  • MySQL 多表查询中,联合查询(UNION) 和子查询
  • 找人做的网站怎么看ftp网站建设移动网络
  • 建网站pc版 (报价)淮安网站建设
  • 【实战记录】MySQL密码遗忘终极解决方案:详解--skip-grant-tables原理与全平台重置流程
  • Linux命令之pgrep用法
  • 网站设计要注意事项网站开发工程师的经验
  • 网站备案 座机wordpress 搭建论坛
  • 保定做网站建设河南网站怎么备案
  • 做网站和维护要多少钱wordpress朋友圈图片不显示
  • 零基础新手小白快速了解掌握服务集群与自动化运维(十一)MySQL数据库基础
  • 超越提示词:Anthropic 揭示下一代AI智能体的关键——上下文工程
  • 永康建设局网站天台县低价网站建设
  • 大数据存储优化:从 Mysql 到 Redis Bitmap ,高效存储用户签到记录
  • 网站地图怎么做的晋江做网站模板
  • 卷积神经网络CNN(一):卷积操作
  • RynnVLA-001-7B: 使用人类演示增强机器人Manipulation--达摩院--2025.9.18--开源
  • 网站怎么更新数据云南模板网站建设公司