全基因组关联分析(GWAS)-群体结构与亲缘关系
2018-10-19 本文已影响24人
Zhigang_Han
1、群体结构及其对 GWAS 的影响
群体结构的来源
image.png
群体结构对GWAS的影响--混淆变量
Ancestry可以导致混淆变量(confounding variable)
混淆变量: 统计学中,混淆变量是指既与因变量相关又与自变量相关的无关变量。混淆变量其实就是群体结构变量,是潜在的第三者每个亚群的样本共享一种生长习惯和生活方式,导致许多感兴趣的性状直接与亚群或世系相关。
群体结构对GWAS的影响--假阳性
image.png
image.png
image.png
2、群体结构的推断方法
群体结构评估三宝刃
image.png
系统发育树
image.png
model-base的群体结构分析
分析的大致原理:将大群体分成K个服从Hardy-Weinberger平衡的亚群,将各材料归到每个亚群,计算第i个材料其基因组变异源于第k个亚群的可能性(Pritchard et al. 2000),用Q值表示,Q值越大,表明该材料来自这个亚群的可能性越大
image.png
image.png
image.png
用于GWAS的主要结果
image.png
PCA(数学上的计算)
image.png
EIGENSOFT-smartPCA主要结果图示
image.png
基因型与群体结构关联
image.png
3、亲缘关系及其对GWAS的影响
image.png
Kinship的主要来源
① 血缘( Blood relationship) :
家庭关系( Family ties)
血亲关系( Blood ties)
② 共同祖先( Common Ancestry)
③ Sharing of characteristics or origins.
度量方式
• 亲缘系数( Coefficient of Kinship)
• 共祖率( Coancestry)
• 血缘一致性 ( Identical By Decent (IBD))
Kinship的主要方法
计算方法--根据系谱推断
image.png
image.png
根据标记基因型推断
image.png
标记基因型欧式距离
image.png
Nel's Distance
image.png
SPAGeDi(我钟爱的方法)
image.png
VanRaden方法
image.png
image.png
Zhang方法
image.png
各种方法均可使用
image.png
image.png
image.png
image.png
image.png
image.png
image.png
image.png
image.png
image.png
image.png
image.png
image.png
image.png
image.png
image.png
image.png
image.png
image.png
image.png
image.png
image.png
image.png
image.png
image.png