GWAS+自然选择:62个样本的GWAS分析,没信号,如何巧妙的
欢迎来到"bio生物信息"的世界
6天前,BMC Genomics 推了一篇文献“Population history and genetic adaptation of the Fulani nomads: inferences from genome-wide data and the lactase persistence trait”。
要不是这个标题起的太大,又是Population history,又是 genetic adaptation ,我可能都不会点开来看。
但是既然看了,还是要写点总结,毕竟,每一篇能发出来的文章,总是有那么一点值得我们借鉴的。
这篇文章很聪明的一点是,他避开了GWAS没信号这个问题,转而将重点放在:结合表型和人群历史以及遗传适应性来讲。
下面讲讲整篇文章的研究思路。
0. 研究背景
Fulani nomads是在非洲西部的一群游牧民族。
游牧民族最大的特点是什么。当然是(牛/羊)奶多。
所以乳糖耐性就是一个明显受到选择的表型。
这也是他们本次研究采用乳糖耐性作为表型的原因。
讲完背景,我们接下来看看他们做了什么工作。
1. 研究的人群的历史。
62个样本,讲人群历史当然很干巴巴。
那么,就需要增大样本量了。
增大样本量,首选就是千人基因组公共数据库了。 全世界各个群体的基因型数据都有,不嫖白不嫖。
QUQsbR.png这张图用的是EIGENSOFT 做PCA分析,ADMIXTURE推断人群结构。
2.祖先特异性推断
对之前文献发表的乳糖耐性相关变异位点进行祖先特异性推断。
乳糖耐性相关的基因周围的位点多样性降低了,这表明乳糖耐性在这个群体是受到强烈的选择。
QU8esg.md.png3.Fulani人群与乳糖耐性相关的显著位点分析
这一步就是用的GWAS分析。
当然,62个样本,找不到信号也很正常。
因此,作者还结合了Fulani人群的iHS值和XPEHH值,放在一起和GWAS找出来的最高信号一起讨论。
这么一结合,文章的档次就提升了。
QUxCF0.md.png4.结束语
各位找不到GWAS信号的同行,也不用太灰心。
毕竟GWAS只是找遗传位点的一个方法而已,可我们的研究内容不只找遗传位点啊。
项目推不下去的时候,就借鉴别人的研究思路,为自己的项目锦上添花。