公众号论文阅读2025-07-14

2025-07-13  本文已影响0人  土雕艺术家

2025 Nature genetics 泛基因组图谱及其在生物多样性基因组学中的应用

Pangenome graphs and their applications in biodiversity genomics

遗传变异的完整数据集是生物多样性基因组研究的关键。长读长测序技术允许对高度连续、单倍型分辨的参考基因组进行常规组装。然而,即使完整,来自单个个体的参考基因组也可能使下游分析产生偏差,并且无法充分代表种群或物种内的遗传多样性。由高质量基因组的比对集合组装而成的泛基因组图可以通过将来自同一种群、物种或属的多个基因组的序列信息整合到单个参考中来克服表示偏差。在这里,我们回顾了构建、可视化和作泛基因组图的可用工具和数据结构,同时提供了实际示例并讨论了它们在生命之树的生物多样性和保护基因组学中的应用。

即便参考基因组具有较高的准确性,在比对过程中仍可能因参考序列中存在差异或缺失区域而被错误定位或无法比对。
这些“盲区”会导致参考偏倚,进而可能错误反映真实的遗传变异。泛基因组(Pangenomes) 学通过构建专门的复合组装体(即泛基因组),系统性地捕获物种内的遗传多样性,为解决参考偏倚提供了有效途径 。泛基因组最初可以是未比对的序列集合,或基于原始测序数据或组装序列构建的图结构。


image.png

在植物中,泛基因组概念最初用于分析转座子(Transposable elements, TEs),这些元件在基因区和基因间区均造成大量变异。植物基因组表现出高度动态性,经常发生多倍化和二倍化事件,并且种内遗传变异普遍较大。

泛基因组图中的变异位点 (SNP、插入-缺失(indels)和结构变异(SVs))可通过图分解提取。


image.png

ME特邀综述 | 适应性辐射的种群基因组学研究

Population Genomics of Adaptive Radiation

适应性辐射是探索、测试和理解进化和生态学关键理论的丰富实验室,因为它们提供了物种形成和生态适应的壮观展示。适应性辐射研究的特殊挑战包括高水平的物种丰富度、快速物种形成和物种之间的基因流动。在过去十年中,高通量测序技术和群体基因组数据的获取通过在全基因组规模上分析来自许多个体生物体的样本,减轻了这些挑战。在这里,我们回顾了群体基因组数据如何在五个关键领域促进我们对适应性辐射的了解:(1) 系统发育学,(2) 杂交,(3) 多样化的时间和速率,(4) 性状进化的基因组基础,以及 (5) 基因组结构在分化中的作用。我们回顾了每个领域的当前知识,突出了悬而未决的问题,并专注于有助于检测人群随时间变化的差异和人口统计复杂模式的方法。很明显,群体基因组数据正在彻底改变在快速多样化的分支中重建进化历史的能力。此外,研究越来越强调基因流动的核心作用、适应过程中站立遗传变异的再利用以及结构基因组元件作为适应性辐射中物种形成过程的促进因素。我们强调了杂交——以及它塑造多样化的假设过程——以及寻求弥合微观进化和宏观进化过程之间鸿沟的问题,作为未来研究的丰富领域。总体而言,群体基因组数据的访问促进了适应性辐射研究的一个激动人心的时代,对更深入地理解整个生命树的基本进化过程具有重要意义。

适应性辐射是一种宏观进化现象

所有定义都在某种程度上认为,适应性辐射并不是通过其内部发生的微观进化过程来定义的,而是通过物种水平及以上的多样性模式来定义的。

快速多样化的类群可能具有普遍的ILS

特别是,快速多样化的类群可能具有普遍的ILS,导致全基因组范围内的拓扑结构不一致。此外,这种基因组马赛克现象也可能源于古代或近期杂交。事实上,在适应性辐射的早期阶段,多样化过程可能更接近于一种网络状的进化历史,而非传统的过于简化的连续分支模型。

杂交如何塑造辐射的假设过程
image.png

杂交可能以多种不同方式影响适应性辐射。在辐射的起源阶段的杂交可以增加初始种群的可遗传遗传变异,从而摆脱多样化受缓慢突变积累速率限制的困境。在适应性辐射过程中的杂交可能进一步通过新的重组方式提供适应性变异,促进辐射的持续进行。后一种情况下,杂交直接导致物种多样性的一个方式是通过杂交物种形成过程,其中杂交直接导致新物种的形成及其与亲本类群的生殖隔离。在杂交谱系起源中,类群可能经历“融合–裂变”动力学,即先通过杂交谱系起源形成类群,再崩溃,然后重新组合,从而促进极快的多样化。种群基因组数据为所有这些领域提供了关于杂交在适应性辐射中的作用的证据。

功能多样的转座子的水平传递是新内含子的主要来源

Horizontal transmission of functionally diverse transposons is a major source of new introns

内含子是真核生物基因组的主要组成部分,起源知之甚少。内含子,即可在插入时产生内含子的转座因子 (TE),被认为是不同谱系中内含子获得的主要驱动因素。然而,内含子动员的分子机制和塑造内含子跨物种分布的进化过程仍然难以捉摸。在这里,我们表明内含子可以来自具有古老起源的高度多样化的 TE。我们发现证据表明,这些元件可以通过水平基因转移在不同物种之间移动,并且巨型病毒可能有助于它们的传播。总之,我们的结果表明,持续的内含子增加在很大程度上是真核生物中 TE 活性和基因组冲突的结果。

自从在真核生物基因组中发现剪接体内含子以来,产生新内含子的近代分子和进化过程一直是一个关键的谜团。特化转座因子 (TE),即内含子,被认为是多种真核生物中内含子增加的主要驱动因素之一。然而,驱动内含子在谱系内和谱系之间繁殖的分子机制和进化过程仍然难以捉摸。在这里,我们分析了 8,716 个基因组,揭示了 201 个物种的 1,093 个内含子家族,跨越 17 亿年的进化。内含子来源于功能多样的 TE,包括末端反向重复序列 DNA TE、反转录转座子、隐子和螺旋子家族,以及分子机制未知的移动元件。我们确定了最近在不同宿主物种之间转移内含子的 8 个案例,并表明整合到基因组中的巨型病毒可能促进跨谱系的内含子转移。我们提出持续的内含子增加主要是真核生物中 TE 活性的结果,从而解决了基因组结构进化的一个关键谜团。

转座因子 (TE) — 通过自我复制在基因组中生长的自私基因 — 可能是大多数新内含子的来源。最早的真核内含子和剪切体小核 RNA,可能是从 TE 进化而来的


image.png

最近同源性的证据强烈表明水平传递是真核生物谱系内部和内部传播的主要驱动因素之一。转座因子经常在谱系之间水平转移 (35, 36),HGT 可能是塑造内含子进化的重要现象 (15)。

上一篇 下一篇

猜你喜欢

热点阅读