超级泛基因组时代|最新泛基因组构建策略推荐
超级泛基因组:代表一个属内所有物种的基因组信息,是对泛基因组的进一步扩展。
2020年发表在Trend in Plant Science 上的“Super-Pangenome by Integrating the Wild Side of a Species for Accelerated Crop Improvement”一文中提出了超级泛基因组的概念,并提出早期的泛基因组主要局限于单个物种,缺乏了在属水平的基因组多样性。而今年7、8月份水稻、玉米、家蚕三篇泛基因组的文章,正式的将泛基因组推向了高潮。
参考文献1:A super pan-genomic landscape of rice
发表期刊:Cell Research
研究材料:251份水稻材料,通过地理分布来源、基因型和表型变异精心选择了具有高度代表性的202份亚洲栽培稻核心种质材料,28份普通野生稻、11份非洲栽培稻和10份短舌野生稻。
研究内容:
对251个材料使用WTDBG软件、平均深度98±24×的测序数据完成组装,并使用平均深度64±9X的illumina数据进行组装纠错,平均contig N50长度为10.9±3.7Mb,BUSCO完整性96.4%±1.6%,并与日本晴基因进行比对,均有很好的完整性和连续性。该研究将基于三代测序数据鉴定到的159,491个结构变异信息整合为图形化的变异图谱,并对每个变异位点进行了基因注释和序列的整合,囊括了目前最全面的水稻基因序列的复等位信息。进行了基于泛基因组抗病基因NLRs区域、泛SV对农艺性状的影响、环境适应性、驯化机制等方面的研究。水稻超级泛基因组的构建为发现其潜在的遗传变异、适应和驯化提供了助力,并对了解其他作物的功能和进化基因组学提供了借鉴意义。
图1 251份材料的地理分布及系统发育关系参考文献2:A pan-Zea genome map for enhancing maize improvement
发表期刊:Genome Biology
研究材料:721份玉蜀黍属材料,包括507份现代玉米材料、31份玉米农家种材料以及183份玉米野生近缘种大刍草材料。
研究内容:
将721份材料进行Denovo组装(二代数据)构建泛基因组,基因组大小为6.71G,其中2.41G能够比对上B73参考基因组,4.57G的序列并不在B73参考基因组中。该研究基于玉米的超级泛基因组,对基因PAV和基因特征的联系、SV对表型变异的影响、复杂性状关联分析等内容进行了研究。该超级泛基因组囊括了目前最全面的玉蜀黍属基因组序列信息,极大地扩展了玉米遗传改良的基因池。
图2 玉米黍属超级泛基因组特征参考文献3:High-resolution silkworm pan-genome provides genetic insights into artificial selection and ecological adaptation
发表期刊:Nature Communications
研究材料:1,078份蚕种质资源,205份地方种、194份改良种、632份家蚕材料、47份野桑蚕材料。
研究内容:
对545份材料进行平均深度97X的Denovo组装(Nanopore测序),对其中100个基因组进行了注释来构建泛基因组,并使用SV数据构建了图形泛基因组。该研究基于蚕的超级泛基因组进行了SV对基因表达、驯化繁殖、经济特征、适应性相关基因等方面的研究。该研究采样的全面性,是迄今为止动植物领域最大的基于三代数据多个个体组装进行研究的泛基因组。不仅仅开创了蚕基础研究和分子育种的新时代,并为其他物种的大规模泛基因组研究提供了指导。
图3 蚕超级泛基因组构建从以上文章中我们可以看出,超级泛基因组的构建对基因组的要求也越来越高,不仅局限于种内,更是向属内发展,而且研究的样本数也越来越多,诺禾致源制定了最新的泛基因组构建策略:
1.组装物种样本个数推荐:10-50个,需要具有一定代表性包含野生种、栽培种;每个种至少1-2个样本。
2.测序深度策略推荐: 30X HiFi + 30X Ultra long ONT + 100X Hic。
3.组装策略推荐:
(1)选取1个具有代表性物种进行完美基因组/基因组近完成图构建。
(2)其他多个个体组装物种使用HiFi数据进行组装,并使用Hic数据进行染色体挂载。
(3)可结合大量样本的二代数据进行泛基因组分析。
在PacBio平台规模化后,随着HiFi测序成本的降低,使每个项目均能进行泛基因组的构建。
参考文献
[1]Shang, L., Li, X., He, H. et al. A super pan-genomic landscape of rice.Cell Res 32, 878–896 (2022).
[2]Songtao G, Wenjie W, Chenglin J. et al. A pan-Zea genome map for enhancing maize improvement. Genome Biology, 2022, 23: 178.
[3]Tong, X., Han, MJ., Lu, K. et al. High-resolution silkworm pan-genome provides genetic insights into artificial selection and ecological adaptation. Nat Commun 13, 5619 (2022).