全基因组关联分析(GWAS)-群体结构与亲缘关系
2018-10-19 本文已影响24人
Zhigang_Han
1、群体结构及其对 GWAS 的影响
群体结构的来源
image.png
群体结构对GWAS的影响--混淆变量
Ancestry可以导致混淆变量(confounding variable)
混淆变量: 统计学中,混淆变量是指既与因变量相关又与自变量相关的无关变量。混淆变量其实就是群体结构变量,是潜在的第三者每个亚群的样本共享一种生长习惯和生活方式,导致许多感兴趣的性状直接与亚群或世系相关。
群体结构对GWAS的影响--假阳性
image.png
image.png
image.png
2、群体结构的推断方法
群体结构评估三宝刃
image.png
系统发育树
image.png
model-base的群体结构分析
分析的大致原理:将大群体分成K个服从Hardy-Weinberger平衡的亚群,将各材料归到每个亚群,计算第i个材料其基因组变异源于第k个亚群的可能性(Pritchard et al. 2000),用Q值表示,Q值越大,表明该材料来自这个亚群的可能性越大
image.png
image.png
image.png
用于GWAS的主要结果
image.png
PCA(数学上的计算)
image.png
EIGENSOFT-smartPCA主要结果图示
image.png
基因型与群体结构关联
image.png
3、亲缘关系及其对GWAS的影响
image.png
Kinship的主要来源
① 血缘( Blood relationship) :
家庭关系( Family ties)
血亲关系( Blood ties)
② 共同祖先( Common Ancestry)
③ Sharing of characteristics or origins.
度量方式
• 亲缘系数( Coefficient of Kinship)
• 共祖率( Coancestry)
• 血缘一致性 ( Identical By Decent (IBD))
Kinship的主要方法
计算方法--根据系谱推断
image.png
image.png
根据标记基因型推断
image.png
标记基因型欧式距离
image.png
Nel's Distance
image.png
SPAGeDi(我钟爱的方法)
image.png
VanRaden方法
image.png
image.png
Zhang方法
image.png
各种方法均可使用
image.png