生信数量遗传或生统基因组研究

如何利用泛基因组来深度发掘一个物种?

2021-01-09  本文已影响0人  生信阿拉丁

作者:童蒙
编辑:amethyst

大豆是一种非常重要的油料和蛋白质来源。为了研究其基因组多样性,需要构建高质量的泛基因组。作者denovo组装了26个代表性的大豆,同时对2898个大豆进行了重测序,结合之前发表的基因组,构建了一个graph-base genome,并且进行相应的分析,得到了许多二代测序不能被发现的遗传变异。通过研究SV和转录组的变化,可以更好的发掘性状背后的基因。

背景介绍

01 泛基因组介绍

02 大豆的介绍

03 文章创新点

材料与方法

采样与实验

分析内容

结果

01 组装的结果

使用2898个重测序,每个13x,获得了31M个SNP;并且构建进化树,将2898个accession分成6个大类。组装结果都还是很好的,见下图。重复序列的占比也都比较稳定,在55%左右,基因数目也比较恒定。

02 鉴定核心和非必须基因集

定义了softcore gene(存在于25个个体中的基因家族)、dispensable gene(存在于2个个体中的)、private gene(只存在于1个个体中的),结果比例如下图。虽然dispensable gene和private gene的个数多,但是在单个样品中比例不高。可以看出core gene和softcore gene在50%左右,dispensable gene为50%左右。

core gene有更高的domain比例,同时π和dn/ds也比较低,说明core gene更保守,这个很容易解释。

03 鉴定SV

04 构建图基因组

SV也可以分为core,softcore,dispensable,private。发现重复区域中富含SV。
构建了一个图基因组,然后使用图基因组,来鉴定sv。precision、recall和F1分别为0.94,0.75,0.83。还是一个比较高的检测效力。

05 研究基因结构的变化

展望

建立了一个pan-genome,为后续的研究提供了很好的基础。

这是一篇经典的文章,里面内容很丰富很详实,值得多读几遍。里面涉及了一些功能的内容,由于小编对这块不熟悉,就没有去解读了。大家如果想继续了解,可以去阅读原文。

参考文献
Liu Y , Du H , Li P , et al. Pan-Genome of Wild and Cultivated Soybeans[J]. Cell, 2020, 182(1).

上一篇下一篇

猜你喜欢

热点阅读