泛基因组的研究内容
泛基因组概念
泛基因组是指一个生物分支(物种)的全部基因信息,可以分为由所有个体共享的核心基因和由部分个体共享或者是部分个体所特有的非必需基因。即泛基因组捕捉一个物种全部的基因组信息。
泛基因组的发展过程
第一阶段:2005年,首次提出了微生物泛基因组的概念,泛基因组即某一物种全部基因的总和
第二阶段:2009年,泛基因组测序首次应用于人类基因组研究
第三阶段:2013年,泛基因组测序开始应用于动植物基因组研究
第四阶段:2014年,开始了粮食作物的泛基因组研究,例如水稻、大豆、玉米等
为什么要做泛基因组?
在漫长的物种进化的过程中,在自然选择和人为选择的压力下,每个个体都形成了极其特异的遗传性状,单一基因组测序通常只能覆盖基因组的80%-90%,而且一般只有代表驯化的优良品种的单一基因型能够被准确的检测到,因此不同生态型的重测序数据一般只有50%-80%能够比对到参考基因组上,如果只使用单一基因组进行遗传驯化变异研究的话,可能会丢失掉很多有意义的基因信息。泛基因组的构建在于捕捉一个物种全部的基因组信息,以解决单个参考基因组在群体研究中的多种限制,通过构建参考基因组可以获得每个物种中代表性个体的特异基因序列,并把这些序列加入到泛基因组中,从而获得物种更加完整的基因组信息,因此参考基因组是确定群体变异检测全面性和准确性的关键。
研究方向
1)谱系基因组:适用于不同属、不同科下的物种,以探究物种间的进化谱系为核心来开展研究,构建大规模的群体基因组denovo,探索物种形成历史,分化地位,物种适应性,群体特征,趋同进化等
2)种间差异研究:适用于同属内多个种间之内的研究(有一定的亲缘关系),由于分化的时间不是很久远,亲缘关系较近的材料间会有相似的或是相异的性状特征,那么导致这些差异背后的原因是什么?常规的重测序分析难以使用一套参考基因组来进行不同种之间的变异分析(因为比对率都不同),因此可以将这些材料分别进行denovo,并通过基因组间的变异分析掌控物种的起源进化及功能关系
3)泛基因组研究:适用于同种内多个品种/野生栽培驯化种,泛基因组即某一物种全部基因的总称,植物的泛基因组要比任何个体的基因组要大的多,而且任何个体中的相当一部分基因都只存在于某些基因组中
4)种内变异研究:适用于同种水平内存在性状差异
泛基因组的主要研究内容
1)核心基因:在所有的品系中都存在的基因
2)非核心基因:在一个以及一个以上的品系中存在的基因
3)特有基因:仅在一个品系中存在的基因
Summery:从进化的角度上来讲,泛基因组鉴定到的核心基因可能是执行关键功能的基因,在一些物种中趋向于一些保守性基因,相反,非核心基因促进了物种多样性,能够加强物种对各种环境的适应,因此,非核心基因可能进化的更快。核心基因富集到基本的细胞功能,控制着生命体基因的新陈代谢,而非核心基因则富集到与环境和防御反映、受体和抗氧化活性、基因调控以及信号转导等相关的功能,非核心基因是农业上重要性状表型变异的主要贡献者,并且对于提高农作物的生产力特别重要,同时也在适应性进化和驯化中起关键作用。
泛基因组的构建方法
1)Denovo 从头组装:要求比较高,要求拿到的每一个个体 都需要高质量的基因组测序及组装,在测序组装完成后,再进行插入缺失变异的检测,最终来构建一个泛基因组
2)Lterative 迭代组装:需要一个比较高质量的参考基因组,其他个体的测序数据都要与这个个体进行比对,然后我们就能得到差异序列,之后的组装过程中,这些差异序列和参考基因组将共同构成泛基因组
3)Map-to-pan 图谱:先分别进行Contigs组装,然后与泛基因组进行比对,未比对上的Contigs被添加到泛基因组中