文献分享26:优质牧草羊草的基因组演化与育种
文献
2023
PNAS
Genome evolution and initial breeding of the Triticeae grass Leymus chinensis dominating the Eurasian Steppe
课题背景
(1)羊草 (Leymus chinensis, 2n = 4 × = 28, NsNsXmXm)是一种多年生的根茎草,属于禾本科中的小麦族。由于其强大的根茎网络以及极强的抗盐碱、冰冻和干旱能力,它在草地恢复方面备受重视。L. chinensis广泛分布在在欧亚大草原上,从朝鲜北部一直延伸到蒙古、中国北部,以及西伯利亚的西北部。除了其生态优势外,L. chinensis也因其丰富的叶片、可食性和高营养含量而作为有价值的牧草。尽管我们越来越多地认识到其生态价值和经济价值,但由于缺乏参考基因组序列,限制了在基础研究和野生种改良方面的发展。
(2)小麦族包括多种不同的基因组,包括A(Triticum, 小麦属)、B/C/D/G/M/N/S/U(Aegilops, 山羊草属)、E/J(Lophopyrum, 麦草属)、F(Eremopyrum, 旱麦草属)、H(Hordeum, 大麦属)、Ns(Psathyrostachys, 新麦草属)、Q(Heteranthelium, 异花麦属)、V(Dasypyrum, 簇毛麦属)、St(Pseudoroegneria,拟鹅观草属)和R(Secale, 黑麦属)。这个族群的成员构成了全球重要的食品和牧草作物,其中包括Triticum aestivum、Triticum urartu、Aegilops tauschii、Triticum turgidum、Hordeum vulgare、Secale cereale和Thinopyrum elongatum等几种基因组已经在染色体水平上完成了测序的物种。
(3)传统上,将野生植物驯化和改良成地方品种和栽培品种需要数个世纪甚至千年的时间。现代基因编辑技术大大加速了这一过程。在自然界中,野生植物保持高抗生物和非生物胁迫的能力,但通常产量较低;因此,快速提高产量是提高它们实用性的关键。对于羊草来说,由于其异源四倍体基因组和自交不亲和性,传统的杂交育种需要耗费大量时间和劳力。基因编辑技术的发展能够在几代内迅速改良羊草。
亮点
在本研究中,作者组装了羊草高质量基因组,并通过基因组编辑技术成功提高了羊草的产量。
结论1 羊草基因组的组装及注释
Fig 1A
作者从中国东北地区获得了羊草的野生植株,命名为Lc6-5。它具有强大的地下茎(Fig 1A),并且表现出出色的遗传转化能力,选择它用作基因组组装。
Fig 1B-E
K-mer评估显示基因组大小约为7.99G,这与流式的结果(8.21±0.25Gb)相似。通过K-mer评估,Lc6-5的杂合率为1.37%(Ns为1.13%,Xm为0.99%)。使用PacBio HiFi数据组装得到354个contig,contig N50为318.49Mb,总大小为7.85Gb,占预估基因组大小的98%。然后使用917.68Gb的Hi-C数据生成了14个伪染色体(Fig 1B),与核型分析得到的结果一致(Fig 1C)。
在BUSCO基因中,该组装结果检测到了98.5%,LAI值为17.65,远远超过了作为参考基因组的标准。此外,根据Merqury的K-mer完整性度量标准,99.93%的K-mer被1,551,171,832个测序读数所识别,基因组水平的准确性评估为99.996%。上述分析都表羊草基因组得到了很好的组装。然而,由于羊草基因组的高杂合性,作者另外进行了单倍型水平的组装,并估计了其质量以确保进一步的研究。
作者共注释到6.89 Gb的转座子,占基因组的87.76%。与大多数植物基因组一样,长末端重复转座子(LTR-RTs)占据了基因组的70.65%,是含量最多的转座子。共注释到84,641个编码蛋白质的基因。此外,还注释到3,982个tRNA、936个rRNA、5,338个小核RNA(snRNA)和3,132个小核仁RNA(snoRNA)。
结论2 羊草的亚基因组分类和异源多倍体化
Fig 2A-B
为了区分羊草的两个亚基因组,作者使用亚基因组特异性K-mer进行了亚基因组分型分析,将14条染色体分成两个不同的亚基因组:subgenome-1 和 subgenome-2(Fig 1D)。为了区分Nm-subgenome和Xm-subgenome,作者对二倍体 Ns-genome (P. juncea)进行了重测序并比较了重测序数据对羊草基因组的覆盖率。结果发现subgenome-1具有更高的覆盖率,因此将其称为Ns-subgenome,subgenome-2称为Xm-subgenome (Fig 1E).
为了深入了解羊草的系统发育,作者选取了8份小麦族的基因组以及用二岁短柄草 (Brachypodium distachyon)和水稻 (Oryza sativa)作为外群构建了进化树(Fig 2A)。作者发现Ns-subgenome和Xm-subgenome之间的分化发生在约16.79个百万年前(Fig 2A)。基于同源基因对的4DTv分析显示了两个明显的峰值(Fig 2B)。早期的峰值约为0.45,表示大约在106.5-109.7百万年前发生了一次古全基因组重复事件,可能属于单子叶植物谱系中的tau(τ)事件。第二个峰值约为0.02,表明Ns-subgenome和Xm-subgenome的异源多倍化事件发生在4.18百万年前(Fig 2B)。
Fig 2C-G
此外,基因组内的共线性分析表明Ns亚基组和Xm亚基组在Chr4和Chr5之间发生了易位(Fig 2C)。为了确定易位发生在哪个亚基组上,作者对这两个亚基组以及其他小麦族物种进行了共线性分析。结果显示Xm亚基组与Th. elongatum(E-基因组)具有更好的协同性,没有发生易位(Fig 2D)。目前,一般认为Th. elongatum的染色体代表了小麦族的共同祖先中的原始同源染色体组,因此,在L. chinensis上的易位事件发生在Ns亚基组而不是Xm亚基组。易位的区域位于4Ns: ~510 Mb至566 Mb和5Ns: ~429 Mb至481 Mb之间,包括1,366个基因(4Ns上的738个基因和5Ns上的628个基因)。此外,在T. aestivum的A亚基组和二倍体T. urartu中也观察到了类似的易位事件(Fig 2D),与先前的研究一致。
为了进一步研究异源多倍体化后亚基组的特征,作者比较了两个亚基组之间的基因密度和转座子含量。通过使用1-Mb滑动窗口,作者发现亚基组之间的基因密度和TE含量存在显著差异,Xm亚基组具有更高的基因密度和更低的TE含量(Fig 2E-F)。此外,对13,209个单拷贝同源基因对进行了两两比较,结果显示在叶片、根和根茎中,转录本表达略微偏向Xm亚基组。对于在不同组织中普遍存在同源表达失衡的2,427对基因,约54%偏向于Xm亚基组。为了探究这些基因的差异表达是否与进化有关,作者计算了两个亚基组中所有基因的非同义/同义替代(Ka/Ks)值,结果显示Ns和Xm之间存在差异,Xm的进化速度比Ns快(Fig 2G)。
结论3 转座子参与了基因组进化
Fig 3A-C
在小麦族基因组中,L. chinensis中的Ns(3.57 Gb)、Xm(2.19 Gb),T. aestivum中的A(4.24 Gb)、B(4.39 Gb)、D(3.29 Gb),T. urartu(3.90 Gb),A. tauschii(3.63 Gb),Th. elongatum(3.89 Gb),H. vulgare(3.70 Gb),和S. cereale(6.99 Gb)的转座子含量与基因组大小呈现显著的正相关(Fig 3A)。
值得注意的是,尽管具有不同的基因组倍性,S. cereale和L. chinensis的基因组大小和转座子含量相似。这与转座子插入驱动基因组扩张的主要因素,而非多倍化的观点是一致的。与小麦族的其他成员类似,LTR-RTs(主要是Gypsy和Copia)是L. chinensis中最丰富的转座子类型(Fig 3B)。此外,作者鉴定到三次最近的LTR插入,其中Gypsy的插入在0.43 MYA和1.51-1.84 MYA具有双峰分布,Copia的插入在0.65-0.72 MYA具有单峰分布,同时存在于两个亚基因组中(Fig 3C)。有趣的是,这些LTR-RTs的爆发时间与更新世的时间(约0.01 MYA到约1.8 MYA)相吻合,更新世以大规模气候波动而著名。
Fig 3D-E
作者对完整的LTR-RTs进行了进一步分析,以研究Copia和Gypsy不同家族之间的进化关系,以及它们对两个亚基因组的贡献。基于逆转录酶结构域的系统发育树显示,Copia和Gypsy是两个独立的超家族,Gypsy有六个主要分支,Copia有八个分支(Fig 3D)。Gypsy的成员较多(27,661个成员),而Copia的成员较少(10,644个成员),这与Gypsy经历了两次爆发,而Copia只经历了一次爆发一致(Fig 3C-D)。更具体地说,Gypsy的Tekay和Copia的Angela的扩增对L. chinensis的基因组扩张做出了最大的贡献(Fig 3D)。
在比较亚基因组时,作者发现Ns和Xm之间各个家族的分布模式是相似的(Fig 3E),这可以解释它们的基因组大小相似(Ns为3,998 Mb,Xm为3,715 Mb)。之前的GISH(基因组原位杂交)实验,该实验利用二倍体的Ns祖先Psathyrostachys基因组DNA作为探针放在Leymus染色体上,证实了两个亚基因组之间的重复序列组分的相似性。这些结果共同表明了Ns和Xm基因组之间的密切关系。
结论4 利用基因编辑系统对羊草进行可诱导的遗传修饰
Fig 4A-C
基于最近在小麦中成功使用的转化方法,作者开发了一种针对L. chinensis的遗传转化体系。对于 L. chinensis,基因型Lc6-5可以实现遗传转化(Fig 4A)。作者使用种子、未成熟胚和未成熟穗作为外植体,进行愈伤组织的诱导和再生效率的评估。在这三种组织中,未成熟穗显示出最高的再生效率。因此,作者选择未成熟穗用于 L. chinensis 的转化(Fig 4A)。
miRNA是一种保守的调控因子,在植物的生长、发育和逆境适应等方面起着重要作用。通过对L. chinensis的叶、根、根茎和小穗进行小RNA测序,作者共鉴定出393个成熟的miRNA,其中38个miRNA家族在miRBase的植物基因组中是保守的,而13个家族是单子叶植物特有的(Fig 4B)。在L. chinensis中的单子叶植物特有miRNA中,miR528在叶子中表达最高(Fig 4C),这表明它在这个物种中可能具有重要作用。
Fig 4D-E
作者鉴定了对应于5Ns和4Xm上的MIR528的两个位点(Fig 4D)。为了探究miR528在L. chinensis中的功能,作者应用CRISPR/Cas9技术,敲除了L. chinensis中MIR528的两个拷贝,得到了两个MIR528的敲除突变体,mir528-1和mir528-2,它们在两个MIR528位点的所有四个等位基因中都具有突变(Fig 4D)。根据northern blot 结果,几乎无法在mir528-1和mir528-2中检测到miR528(Fig 4E)。
Fig 4F-G
在将T0转基因植株种到土壤中时,作者发现两个mir528突变体比它们的阴性对照植株NC产生更多的分蘖,这表明阻断miR528可能促进了分蘖能力(Fig 4F-G)。
Fig 4H
为了进一步确认这一表型,作者将阴性对照NC和mir528突变体的每棵植株的一个分蘖移植到新的盆中,观察它们的分蘖生长。一个月后,两个mir528突变体都产生了三到四个分蘖,而NC只有一个或两个分蘖(Fig 4H)。在移植后三个月,mir528突变体的分蘖数也有所增加(Fig 4H)。
Fig S11
此外,作者分析了敲除突变体与野生型的转录组,并鉴定了显著差异表达的基因(Fig S11A)。此外,作者使用psRNATarget(https://www.zhaolab.org/psRNATarget/analysis 预测了MIR528的35个潜在靶基因。GO富集显示这些基因大部分含铜蛋白并与氧化还原过程相关(Fig S11B)。这些结果表明miR528对L. chinensis的分蘖具有负调控作用。
综上,作者在L. chinensis中进行的基因编辑和遗传转化系统能加速L. chinensis的驯化和改良与生物量相关的性状,为多倍化和自交不亲和的牧草品种改良提供了一个范例。
本文使用 文章同步助手 同步