群体遗传学生信

1.GWAS:原理与目的

2021-11-15  本文已影响0人  Wei_Sun

全基因组关联分析(Genome-Wide Association Study, GWAS)是以连锁不平衡(LD)为基础,利用全基因组范围内群体中高密度的分子标记,鉴定与复杂性状表型变异相关联的分子标记,进而挖掘与表型相关基因的方法。

关联定位的优势:

关联定位的缺点:

关联分析的基础:连锁不平衡(linkage disequilibrium, LD)

D' 的计算方法如下:


D' =D/Dmax

D<0, Dmax = max { -PAPB , -(1-PA)(1-PB)} ;

D>0, Dmax = min { PA (1-PB), (1-PA)PB} ;

D' =1,表示连锁完全不平衡,没有重组;

D' =0,表示连锁完全平衡,随机组合,独立遗传。

D' 也有它的局限性,比如当单倍型为两种或三种时,| D' |一定等于1,但是当| D' |<1时,D' 的值究竟表示多大程度的连锁不平衡,是很难做出准确判断的。另外D' 严格依赖于样品的大小,如果样本偏少时,SNP数量比较少,这样算出来的D' 就会偏大,尤其是某个位点其中一个等位基因频率很低时,因此较高D' 背后,实际上可能是连锁不平衡程度很低的两个位点。因此引进r 2来表示LD,r 2的计算方法如下:

r 2=1,表示连锁完全不平衡,没有重组;
r 2=0,表示连锁完全平衡,随机组合,独立遗传。

r 2和D' 是衡量LD的常用指标,关系如下:

引用转载请注明出处,如有错误敬请指出。

上一篇 下一篇

猜你喜欢

热点阅读