Science | 群体研究新思路:De novo + GWAS
前言
GWAS,即全基因组关联分析(Genome Wide Association Study),是指在全基因组范围内对多个个体(一般300个以上)的单核苷酸多态性(SNP)进行检测,并进而将基因型与表型性状进行群体水平的统计学分析,根据统计量或显著性(p 值)筛选出与表型性状相关联的SNP位点,从而挖掘与表型相关的基因。GWAS分析依赖于高质量的参考基因组信息,对于群体数量足够大但没有高质量参考基因组的物种,首先利用三代de novo测序数据组装一个高质量染色体级别的基因组是非常有必要的。今天为大家分享的这篇文章将de novo测序与GWAS完美结合,下面让我们一起来解读一下吧。
发表期刊:Science
发表时间:2020.07
影响因子:41.845
背景介绍
受气候变化的影响,世界范围内的珊瑚礁正在急剧减少。升高的海水温度会导致珊瑚的白化 ——珊瑚宿主和它们共生鞭毛藻科的细胞内光合作用被破坏。因为微生物提供了宿主所需的最大能量,长时间的虚弱最终会导致群体的死亡。面对快速上升的温度,迫切需要新的保护策略来防止珊瑚覆盖的大规模损失,同时也需要人们对珊瑚白化的遗传基础有更多的了解。
珊瑚品种内部和种类之间对白化的反应各不相同。在印度洋-太平洋地区的一种单一分布的造礁珊瑚中,这些差异至少在一定程度上是遗传的。研究者展示了利用基于基因组的方法来决定个体反应的可行性,并提出了可以为珊瑚保护提供新策略的方法。
研究结果
1. 研究者组装了一个染色体级别的基因组,并对分布在中心大堡礁的12个珊瑚礁上的237个样本(收集于2017年白化高峰期)进行了全基因组重测序。
利用混合测序的方法,研究者构建了一个珊瑚虫基因组的从头组装,通过对两组共生幼虫的reads比对,筛选出共生体的contigs,将组装的珊瑚contigs与先前发表的连锁图进行比对,从而创建一个染色体级别的组装(图1)。通过重测序分析,共得到44个基因组全覆盖的基因序列重排的基因组信息。然而,研究者发现在这些采样点上所收集的样本中几乎检测不到种群结构的存在(图2),因此推测这种基因模式在中心大堡礁上跨越几百公里的地理距离的现象,大概是其散播产卵繁殖的结果(图3)。
图1 | 基因组组装与珊瑚群体样本采集
图2 | 珊瑚样本的遗传变异性质和推测的群体结构历史
图3 | 12个珊瑚礁上取样珊瑚的种群结构和基因流动特征
2. 研究者通过扫描基因组区域在44个重排的基因组中寻找珊瑚虫对环境适应的信号,扫描结果指向一种热休克蛋白伴侣sacsin(图4)。
分析显示,sacsin的变异已经维持了非常长的时间(数百万代),表明该基因是平衡选择的目标,在野外和实验室中都具有重要的功能。然而,平衡选择的来源尚不清楚,而且,单倍型频率与遗传或环境的主成分之间也不存在显著关联性(P > 0.15)。
图4 | 局部适应的基因组扫描检测到sacsin的信号
3. 研究者将低覆盖基因组和高覆盖基因组相结合,获得了237个样本中约680万个位点的基因型,用于白化表型的GWAS分析。
结果表明,低覆盖度排序方法可以同时获得白化的定量测量和共生体类型的相对组成(图5)。对于GWAS分析的目测结果,最高的峰包含13号染色体上的两个基因和3号染色体上的一个基因的区域,但这些关联还有待证实,而14号染色体上的三个基因中有几个基因可能与珊瑚的应激反应有关(图6)。
图5 | 高通量测序揭示共生体物种与白化反应的关系
图6 | 白化反应的GWAS分析和预测精度
主要结论
理解耐热性和耐白化性的基因对于预测珊瑚适应气候变化以及未来珊瑚礁生态系统的发展至关重要。研究者展示了一个基于环境因素、来自共生体的基因组数据和珊瑚宿主的全基因组关联数据的模型,可以帮助区分对白化最耐受的个体和那些最易感的个体。这些结果为预测白化反应奠定了基础。
编者按
欧易生物拥有专业的动植物基因组研发团队,为客户提供从PacBio三代测序、de novo组装、基因注释、基础分析,到比较基因组、个性化分析及多组学联合分析(转录组/代谢组/群体进化/GWAS/ BSA/ QTL/遗传图谱)等高质量的技术服务,博士级专业人员,经过多年经验沉淀积累,具备多角度分析问题能力,提供多元化项目技术服务,多组学技术平台联合支撑,极力打造一站式服务。