泛基因组_从头学习_

泛基因组 | 2022《Cell Research》稻属超级泛基

2023-03-21  本文已影响0人  iBioinformatics

将同一属内不同种遗传变异的泛基因组整合在一起构建的超级泛基因组可以更好地代表整个属的遗传变异。稻属包括亚洲栽培稻 ( Oryza sativa,Os) 和非洲栽培稻(O. glaberrima,Og)两个栽培种,它们分别从普通野生稻和短舌野生稻驯化而来组装了251份高质量的水稻基因组,构建了目前植物中群体规模最大的、基因组充分注释的、稻属中最为系统的超级泛基因组。该图谱的完成将极大地促进水稻功能基因挖掘和水稻种质资源利用。相关研究成果于2022年7月12日以 “A Super Pan-Genomic Landscape of Rice”为题发表在Cell Research(影响因子46.297)上。

Os由亚洲野生稻 ( O. rufipogon , Or ) 驯化而成,主要有两种类型:Geng ( Os. japonica , Osj ) 和Xian ( Os. indica , Osi)。Osj早在9000 年前就被驯化了,而Osi形成较晚,从Osj的驯化等位基因渗入。

大约 3500 年前,Og是从O. barthii ( Ob ) 驯化而来的,而O. barthii (Ob)大约在 600,000 年前与Or分道扬镳。

对包括单核苷酸变异和结构变异(SVs)在内的一整套遗传变异的鉴定,有助于研究栽培稻和野生稻的种群结构和进化动态,加深了对适应、驯化、和物种形成。然而,应该注意的是,遗传变异通常是针对单个参考基因组进行鉴定的;因此,与参考基因组不存在或高度分歧的 DNA 序列被忽略。泛基因组结合了多个基因组,试图代表一个物种的整个基因集,可以帮助克服序列缺失的问题。水稻是中国第一大粮食作物,中国也是世界上最早种植水稻的国家。在水稻基因组学研究上,中国也一直走在世界前列。20年前,中国科学家独立绘制完成并成功“解读”了水稻基因序列,这也是人类第一次在基因组层面认识了水稻。5年间,中国科学家已完成构建4个水稻泛基因组,包括使用453个亚洲栽培稻种质的短读长构建的泛基因组、使用53亚洲栽培稻和13个普通野生稻种质的短读长迭代组装的泛基因组、使用32个亚洲栽培稻和1个非洲栽培稻种质的长读长组装而成的泛基因组和使用105个亚洲栽培稻和6个普通野生稻的长读长组装而成的泛基因组。

水稻驯化的过程中经历了高强度的人工选择,导致栽培稻相对于野生稻祖先遗传多样性减少,成为目前培育水稻品种的制约因素之一

该研究通过地理分布来源基因型表型变异 精心选择了具有高度代表性的202份亚洲栽培稻核心种质材料,28份普通野生稻、11份非洲栽培稻10份短舌野生稻。对所选择的251份水稻核心种质材料进行长读长纳米孔(Nanopore)测序和 Illumina 短读长重测序,利用自主开发的WTDBG软件从头组装了251份高质量水稻基因组序列,并对每个基因组做了充分的注释。

De novo assembly and annotation of the 251 accessions

然后,基于序列和蛋白相似性分别构建了以非冗余序列和非冗余基因为代表的泛基因组。该研究将基于三代长读长数据鉴定到的159,491个结构变异信息整合为图形化的变异图谱(Variation graph)。这种变异图谱形式的泛基因组能够帮助研究人员利用已有的二代重测序数据获取相应水稻材料的结构变异(Structural variation,SV)。为了方便在群体水平上准确地比较等位基因在不同水稻材料中的遗传变异,研究者还利用高质量的群体基因组构建了基于基因组序列比对的泛基因组图谱,并对每个变异位点进行了基因注释和序列的整合,囊括了目前最全面的水稻基因序列的复等位信息。

水稻超级泛基因组基因序列及变异

该泛基因组图谱可以帮助研究者充分挖掘与利用水稻功能基因遗传变异。抗病基因NLRs(leucine-rich repeat genes)区域经常存在复杂的SV,对不同水稻材料中的抗病基因的等位变异进行鉴定和比较非常困难。研究人员利用泛基因组图谱通过整合NLRs注释信息,构建了水稻泛NLRome,确定了泛NLRs家族基因的共线性。为抗病基因功能和进化研究提供了基础,也给群体水平的复杂基因家族或者复杂的染色体区域研究提供了借鉴。

Characterization of NLRs in super pan-genome

研究人员利用他们构建的泛基因组序列和对应的群体表达数据,对两个已知初定位QTL进行重新分析,分别快速确定了产量相关性状的候选基因,并通过实验验证了候选基因的功能。群体水平的泛基因组序列可以帮助研究者从群体的水平上对复杂QTL定位区间序列的单倍型精准解析,大大加快功能基因挖掘的进程。

SVs can affect agronomic traits by altering gene expression

该泛基因组图谱为水稻比较基因组学和进化基因组学研究提供了重要基础。亚洲稻和非洲稻的比较基因组研究,揭示了亚洲栽培稻和非洲栽培稻重要农艺性状驯化和环境适应的遗传基础。利用泛基因组序列解析了与水淹反应相关的已知基因在5个不同水稻亚群中的单倍型分布和群体分化程度,发现非洲水稻和亚洲水稻中这些耐水淹基因可能发生了独立的变异来适应水淹环境。株型由野生稻匍匐生长转变为栽培稻直立生长是水稻驯化过程中的关键一步。前人研究表明,野生稻中都存在一个由多个串联锌指基因构成的RPAD位点,而在栽培稻基因组中仅有一个锌指基因,分别是prog1prog7。在亚洲栽培稻驯化过程中,PROG1功能丧失及与其紧密连锁的110 kb片段缺失,导致亚洲栽培稻株型变直立。而在非洲栽培稻prog7基因组区域内也存在130 kb左右大片段缺失,但是该缺失片段内调控水稻匍匐生长习性的基因并不清楚。利用泛基因组图谱比较了普通野生稻和短舌野生稻RPAD位点的差异,发现其在种内和种间均存在明显的分化,并且在驯化过程中,非洲栽培稻与亚洲栽培稻都在RPAD位点发生了大片段缺失,但是非洲栽培稻与亚洲栽培稻分别保留了RPAD位点两端的不同锌指基因,该结果不仅揭示了非洲栽培稻株型驯化的分子机理,也为大片段结构变异驱动作物平行驯化提供了重要的分子证据。

GWAS analysis using SVs Submergence adaption and domestication shattering of Asian and African rice 基于群体泛基因组解析结构变异驱动的亚洲稻和非洲稻株型的平行驯化

为了高效方便地利用这些海量的基因组数据,研究人员还构建了数据库RiceSuperPIRdbhttp://www.ricesuperpir.com/)。通过数据检索,可以高效地获得特定水稻品种基因组序列及基因组注释,还可以选择任意样本基因组为参考基因组,查看与所有材料的全基因组比对结果和基因组变异。该网站对利用这些基因组信息研究水稻基因功能研究和种质资源利用具有重要的科学意义和实用价值。

Cell Research同期发表了圣路易斯华盛顿大学Kenneth M. Olsen教授对于该工作的评论文章。Olsen教授认为基因组相关研究的贡献不仅取决于单个基因组的组装质量,也取决于其包含的自然变异多样性。Shang等人发布了第一个包含亚洲栽培稻和三个近缘物种在内的水稻“超级泛基因组”,该研究极大促进了我们对于水稻基因组的理解,相关种质资源及数据对基础研究有重要价值。

原文链接:https://www.nature.com/articles/s41422-022-00685-z

评论文章链接:https://www.nature.com/articles/s41422-022-00699-7

黄学辉 教授 (上海师范大学)
泛基因组(Pan-genome)是指一个物种内所有基因组信息的总和。相比单一参考基因组,泛基因组信息包含了丰富的遗传多样性,可有效降低参考基因组偏差对遗传变异检测的影响。该研究团队选取了251份来自不同类群的亚洲栽培稻、普通野生稻、非洲栽培稻及短舌野生稻材料,对它们进行了长读长测序、从头组装、基因组注释和结构变异鉴定,获得了一份高质量的水稻泛基因组图谱。这套群体水平的超级泛基因组,无论是材料选择、样本大小还是组装质量都可圈可点,是水稻基因组学研究中一项里程碑式的工作。

在此基础上,该研究团队还开发了这套数据的在线网站,提供给同行们进行水稻组学资源的获取和整合,这将极大地方便科研人员充分挖掘水稻品种中的各类等位变异,精确地鉴定复杂农艺性状的关键变异位点(QTN),进一步推动水稻功能基因组学研究。此外,结合高质量的组学数据,育种家还可以充分利用这251份水稻资源,进行优异基因聚合,创制新的育种材料,实现更高水平的分子设计育种。

田志喜 研究员(中国科学院遗传与发育生物学研究所 )

种内、种间多样性是作物改良的基础。随着研究的深入,基于单一参考基因组解析物种多样性的弊端逐渐显现,例如无法实现基因组复杂区域候选基因的精细解析等。在本文中,研究人员从稻属材料中系统性收集了251份水稻核心种质,组装了高质量基因组,在进行完整注释后构建了目前植物中群体规模最大的超级泛基因组。同时,基于高质量基因组的序列比对完成了泛基因组图谱。该图谱将群体材料每个变异位点的序列和基因注释整合,展示了目前稻属基因组序列最全面、最完整的复等位信息,为群体水平候选片段或等位基因的共线性分析及单倍型比较等研究提供新的切入点和突破口。研究人员以复杂基因家族——抗病基因NLRs为例,详细介绍了基于水稻超级泛基因组开展复等位基因研究的方法。通过提取泛基因组图谱中NLRs信息,成功构建了泛NLRome,在群体水平充分展示NLRs的共线性、重排等信息,不仅能够为NLRs进化相关研究提供了参考,也为基于泛基因组研究复杂基因家族或者染色体区域提供了思路。

最后,作者将所得数据及分析结果在网站上进行可视化,方便相关科研人员以任意研究样本为参考基因组查看与所有材料的全基因组比对结果和基因组注释,查看材料间变异信息。作为植物研究领域的顶级资源和研究成果,不仅是前沿科学挑战的新突破,同时对水稻甚至其他植物的功能研究和分子育种具有不可估量的价值。

https://mp.weixin.qq.com/s/rbIs4jwc7_NvFem-wmQC3w

上一篇 下一篇

猜你喜欢

热点阅读