文献分享29:异源四倍体豆科植物田菁的T2T基因组揭示了转座子驱
文献
2023
Science China Life Sciences
Telomere-to-telomere genome of the allotetraploid legume Sesbania cannabina reveals transposon-driven subgenome divergence and mechanisms of alkaline stress tolerance
课题背景
(1)全球范围内,土壤盐碱化普遍存在。碱性土壤pH值高,离子浓度高,营养物质缺乏,限制了大多数植物的生长。将碱地转化为可利用的农业用地为改善全球粮食生产和安全提供了机会。几千年来,在传统农业中,绿肥一直被用来提高土壤肥力,施用绿肥是改善盐碱地的一种有效方法。绿肥作物有助于保持土壤肥力,减少有害化学品的使用,促进可持续农业。
(2)田菁属 (Sesbania sp.)属于豆科,约52种,分布于全球热带和亚热带地区。异源四倍体田菁 (Sesbania cannabina, 2n=4x=24)是一种快速生长的草本植物,由于其出色的耐碱性土壤和固氮能力,已被用作绿肥以提高土壤肥力,此外,它也作为牛、绵羊和山羊的饲料具有很高的价值。因此,S. cannabina在改良和利用碱性土壤方面具有巨大潜力。目前,在田菁属植物中,只有极少数进行了遗传转化研究,S. drummondii和S. rostrata 但是它们的转化效率仍然很低,迫切需要开发更合适的遗传转化技术。
(3)基因组序列信息有助于我们对田菁逆境耐受性和基因组演化过程的理解。近年来测序和组装技术的进步使得获取完整的基因组组装成为可能,彻底改变了基因组学研究和育种的方式。目前已经为拟南芥、葡萄、水稻和玉米等作物构建了端粒到端粒(T2T)的基因组。这些T2T基因组提供了对重复序列、基因注释和基因组变异的全面、全基因组范围的评估。然而到目前为止,还没有研究田菁的基因组进化、异源四倍体历史和耐碱机制。
亮点
在这项研究中,作者利用三代测序技术进行混合组装,得到了第一个田菁的T2T基因组。基于此,作者深入探讨了田菁基因组的演化,包括亚基因组的排列、异源多倍体化和LTR-RTs驱动的亚基因组分化,并鉴定到四个田菁特异性的与碱性条件相应相关的磷酸盐转运蛋白,突显了它们在育种中增强作物适应碱性土壤磷酸盐缺乏的潜力。
结论1 田菁可以改善碱性土壤
Fig 1
为了找到在碱性土壤中生长的绿肥作物,作者在中国东北地区的田间条件下,对来自13个物种的18个绿肥种质进行了筛选。在这些种质中,豆科植物田菁(S. cannabina)表现出对碱性条件的强大耐受性,甚至在pH>10的碱性土壤中表现出27%-49%的幼苗出苗率,可以在pH>10的土壤中生长(Fig 1A)。为了进一步证实这一点,作者使用碱性土壤(pH约9.7)和黑土壤(pH约7.2)进行了盆栽实验,以比较田菁和中度碱性耐受的豆科植物苜蓿(Medicago sativa)之间的碱性耐受性。结果表明,在碱性土壤中,苜蓿未能存活,但田菁展示出强健的长势(Fig 1B)。这些结果表明田菁具有强大的碱性耐受性。
此外,作者发现田菁在田间强碱性土壤中能够结瘤,具有固氮活性(Fig1C),表明它可能改善碱性土壤。为了探讨这一点,作者评估了在田菁植株长到1.5-2米高后,在收获地上部生物量为24 t/ha后犁地的效果。经过一轮犁地并将根茬归还田地后,土壤pH显著降低了近0.5个单位,电导率(EC)显著降低了22.68%,土壤有机碳(SOC)大幅增加了25.65%(Fig 1D-F),这些结果表明大麻木对改良碱性土壤是有益的。
结论2 田菁的基因组组装和注释
Fig 2A-C
为更好地了解田菁高碱性耐受性的分子基础,作者对LJ5种质进行了测序和组装。使用310.80 Gb(约155×)的Hi-C数据,将大的contig锚定并定向到12个伪染色体上,与核型分析的结果一致(Fig 2A-B)。为构建T2T基因组组装,作者通过将Nanopore超长reads(>100 kb)映射到初始组装上,并使用PacBio HiFi和二代测序对基因组进行抛光,填补了剩余的四个gap。最终基因组大小总计2086.89 Mb,所有染色体均为单一contig组成,没有gap。最终的基因组大小与基于流式和K-mer评估得到的约2 Gb基因组大小相当。
为确定基因组中的着丝粒,作者利用TRASH进行了K-mer分析,鉴定到每条染色体上有一个139个bp的重复区域(Fig 2C),可能是田菁中典型的着丝粒重复序列。Hi-C接触图显示出沿着每个染色体对角线的良好组织的相互作用接触模式(支持信息中的图S4A)。Hi-C接触矩阵的一些区域是空的,缺乏映射的Hi-C读取(支持信息中的图S4B和C)。这些白色区域与每个染色体中心的139个碱基单体重复的巨大卫星阵列的位置重合。这些结果表明139个碱基单体重复可能是每个染色体的着丝点单体。作者对端粒重复(CCCTAAA/TTTAGGG)的分析发现已经成功地在组装中鉴定了所有24个端粒(Fig 2C)。在染色体2A、2B、3A、4B、5A和5B上还鉴定出了六个rDNA簇。作者进一步使用BUSCO和QV评估了组装的完整性和质量,凸显了该参考基因组具有较高的连续性和完整性,可被视为T2T基因组。
Fig S4
Hi-C互作图谱显示出沿着每个染色体对角线的良好的互作模式(Fig S4A)。Hi-C互作图的一些区域是空的,缺乏映射的Hi-C reads(Fig S4B-C)。这些白色区域与每个染色体中心的139bp的单体重复位置重合。这些结果表明139个bp的单体重复可能是每条染色体的着丝粒。在作者组装的参考基因组中,对端粒重复序列(CCCTAAA/TTTAGGG)的分析支持了作者鉴定到了所有的24个端粒(Fig S4D, Fig 2C)。作者进一步使用BUSCO和QV两个指标评估了组装的完整性和质量 (Fig S4E),表明该组装具有较高的连续性和完整性,可被视为T2T基因组。
此外,作者共注释了89970个蛋白质编码基因,其中83065个(92.33%)在公共数据库中具有功能注释。基因组受到转座子的广泛影响,占据了1.52 Gb(占基因组的72.94%)。最主要的转座子是LTR-RTs,占据了基因组序列的52.82%。最丰富的两个LTR亚家族分别是Copia(420.31 MB,占20.14%)和Gypsy(632.77 MB,占30.32%),两者合计占据了所有LTR的95.53%。
结论3 亚基因组分选和异源多倍化
Fig 2D-E
S. cannabina是一种异源多倍体豆科植物,拥有两套染色体。作者对10个二倍体(包括5个S. bispinosa和5个S. rostrata)以及Sesbania属中的5个四倍体物种的基因组SNP做了系统发育分析,主成分分析和K-mer分析显示这12条染色体可以分为两组,分别命名为A亚基因组(Chr. 1A到Chr. 6A)和B亚基因组(Chr. 1B到Chr. 6B)(Fig 2D)。
作者进一步利用进化距离最近的Lotus japonicus计算了这两个亚基因组的演化距离和同义替换率(Fig 2E),发现B亚基因组所有染色体中的单拷贝同源基因与Lotus japonicus的系统发育关系比A亚基因组的基因更为密切。这些结果不仅与亚基因组分类一致,还表明B亚基因组可能比A亚基因组更古老。
Fig 2F
共线性分析表明,尽管S. cannabina与Lotus japonicus具有相同的伪染色体数目,但是所有染色体在它们分化后都经历了染色体断裂和重组(Fig 2F),这些变化可能影响了S. cannabina的演化和适应性。
Fig 3A-B
作者对12种豆科植物以及外类群Mimosa pudica、Oryza sativa 和 Arabidopsis thaliana 构建了系统发育树,发现S. cannabina 与L. japonicus 关系最为密切,在约3,980 万年前发生分化(Fig 3A)。S. cannabina 的亚基因组约在约7.9 百万年前分离。通过Ks分析,作者发现 S. cannabina的A 亚基因组和 B 亚基因组之间存在两个显著峰值(Fig 3B)。这两个峰值对应于物种分化事件和祖先豆科植物的全基因组复制事件。这些结果表明,S. cannabina 经历了一次祖先的全基因组复制,而不是最近的WGD。
结论4 LTR驱动亚基因组进化
Fig 3C
作者对 S. cannabina 的两个亚基因组以及其他测序的豆科植物基因组中TE含量进行了分析,发现LTR-RTs的类型和数量变化非常大(Fig 3C),导致基因组大小从Aeschynomene evenia的303 Mb到Pisum sativum的3,235 Mb不等。在已测序的豆科植物基因组中,S. cannabina、Arachis 和 Pisum 包含最多的LTR-RTs(Fig 3C)。相比之下,S. cannabina 的两个亚基因组显示出Gypsy和Copia逆转录元件的几乎等量扩增。
Fig 3D-E
作者通过构建进化树将来自 S. cannabina 的总共23,227个完整的Gypsy和Copia超家族LTRs分为340个家族(Fig 3D)。Gypsy超家族分为五个主要类群(CRM、Athila、Retand、Ogre和Tekay),而Copia超家族分为八个主要类群。其中,对于Copia和Gypsy超家族,SIRE和CRM是主导的类群。作者还发现A亚基因组和B亚基因组共享大多数类群成员,但SIRE和Tekay的拷贝数量在两个亚基因组之间不平衡,A亚基因组中这些TE的数量明显更多(Fig 3E)。
Fig 3F-H
作者对S. cannabina鉴定到267.93 Mb的结构变异,其中包括238.46 Mb的倒位、10.35 Mb的易位和19.12 Mb的复制。主要的七次大规模倒位事件(>10 Mb)发生在染色体1、2、3、5和6上。对两个亚基因组的每个同源染色体进行比较发现,除了染色体5A和5B之间近60 Mb的长度差异外,大多数染色体对在长度上相似(Fig 3F)。几乎所有同源染色体在TE或基因含量上都没有显著差异,但TE比例在染色体5A中显著高于5B(Fig 3G),这表明染色体长度差异是由TE的扩张导致的。
染色体5A和5B之间的共线性分析表明在Chr5 末端存在约50 Mb的倒位,并在着丝粒附近存在明显差异(Fig 3H)。在染色体5A的60–125 Mb区域检测到几个TE峰,包括LTR型和非LTR型TE。相比之下,在染色体5B的中心区域(57–59 Mb)仅检测到一个峰。这些结果表明TE在染色体5A的扩张中发挥了重要作用,并最终促使了两个亚基因组的分化。在其他已测序的豆科植物基因组中,TE含量与基因组大小之间的相关性分析显示出显著的正相关性。这表明TE在豆科植物基因组的扩张中是普遍存在的,并可能对它们的分化产生影响。
结论5 S. cannabina对碱性条件的耐受机制
Fig 4A-G
为了探索S. cannabina对碱性条件的耐受性,作者对在碱性土壤(pH约9.7)和黑色土壤(pH约7.2)中生长的植物的根组织进行了转录组分析。作者从黑色和碱性土壤的根组织中鉴定了3,684个差异表达基因(上调1547,下调2137)(Fig 4A)。在亚基因组水平上,差异表达基因没有明显的偏倚。
作者对S. cannabina和M. sativa(苜蓿)的比较分析发现了17,097个共同的基因家族,以及10,457个仅属于S. cannabina的基因家族。在这17,097个共同的基因家族中,有1,317个在S. cannabina中独特诱导,而仅有94个基因家族在两个物种中都显示诱导。这些发现表明大麻和苜蓿之间存在着不同的碱性耐受机制。
作者对来自高梁(Sorghum bicolor)的碱碱性抗性基因AT1的分析揭示了与其在S. cannabina中的同源基因存在明显的序列差异,表明这两个物种之间存在不同的碱性耐受机制。此外,作者观察到超氧化物歧化酶家族在碱性土壤胁迫下表达发生了显著变化,表明它们在受到碱性胁迫时调节过氧化氢水平的作用。S. cannabina根组织中上调的DEGs的GO富集显示,与磷酸盐离子相关的生物过程相关(Fig 4B)。这一结果与碱性土壤中可用磷酸盐浓度极低但总磷酸盐浓度不低的事实一致(Fig 4C–F)。
在拟南芥中,磷的吸收依赖于磷转运蛋白(PHTs),这些转运蛋白在磷的获取和稳态中起着关键作用。因此,作者研究了S. cannabina、二倍体M. truncatula和A. thaliana中的PHTs。系统发育分析显示,S. cannabina中的20个PHT基因属于四个分支(Fig 4G)。值得注意的是,其中八个PHT基因(分别位于A和B亚基因组中的四个基因)属于A. thaliana和M. truncatula的PHT1;1,3,5 分支,位于染色体5A和5B上,并发生了基因复制。
Fig 4H-K
作者分析了S. cannabina中所有PHT1家族成员的表达量,其中四个PHT1基因(SC.4BG004299、SC.4BG004301、SC.4AG004483和SC.4AG004478)在根中高表达,并在碱性条件下被特异性诱导(Fig 4H-I)。通过细胞定位证实了S. cannabina 特有的 PHT(SC.4AG004478)专门位于根缘细胞中。为了测试这些蛋白质是否能够直接跨膜运输磷,作者在酵母突变株(YP100)中表达了两个来自S. cannabina的PHTs(SC.4AG004483和SC.4BG004301)。该酵母株在不添加半乳糖的情况下无法生长,因为它缺乏磷的运输功能。作者的结果证实了这两个PHTs的磷运输活性。为了研究这些特异性碱性诱导的PHT1基因是否具有共同的调控机制,作者使用每个基因起始密码子上游2kb序列进行了两两和局部的比对。点状图分析显示,虽然上游序列存在显著的序列变异,但在三个碱性诱导的PHT1基因(SC.4BG004299、SC.4BG004301、SC.4AG004478)的上游存在一个约为135bp的保守区域(Fig 4J)。有趣的是,在任何其他PHT1基因的上游2kb区域中,都没有类似的发现(Fig 4K)。
作者在保守区域鉴定到了一个应激响应motif(STRE)。先前的研究表明,通过STRE介导的转录激活导致对各种应激条件的耐受性。因此,作者认为在S. cannabina中,这些碱性诱导的PHT1基因可能受STRE的调控,以在碱性胁迫条件下增强磷酸盐离子的吸收。
本文使用 文章同步助手 同步