GWAS理论 1-3 群体结构与亲缘关系评估
2020-04-27 本文已影响0人
奔跑的Forrest
一. 群体结构评估
1.群体结构

群体结构评估内容
- 构建系统发育树
- 群体结构分析
- PCA(主成分分析)

a.系统发育树

一般 GWAS 都是种间的,用 NJ 法就可以,maga 就是针对 NJ 法构树的。
系统发育树相关介绍
b.群体结构分析

STRUCTURE 和 ADMIXTURE 现在使用的最多。两者用的模型是一样的。
Structure中群体的亚群数被称为K值。上图中分别列出了K=5-14时的结果。图中每一种颜色代表一个类群,每个个体代表图中的一个小柱状堆叠图,那么我们可以看出有些个体血统较为纯正,有些则出现了混杂。通过颜色我们便可以对种群中的个体进行不同亚群的划分。
关于structure的相关解释http://www.genedenovo.com/news/364.html




c.PCA(主成分分析)

协方差(Covariance)在概率论和统计学中用于衡量两个变量的总体误差。而方差是协方差的一种特殊情况,即当两个变量是相同的情况。
协方差表示的是两个变量的总体的误差,这与只表示一个变量误差的方差不同。 如果两个变量的变化趋势一致,也就是说如果其中一个大于自身的期望值,另外一个也大于自身的期望值,那么两个变量之间的协方差就是正值。 如果两个变量的变化趋势相反,即其中一个大于自身的期望值,另外一个却小于自身的期望值,那么两个变量之间的协方差就是负值。


二. 亲缘关系评估





这里 F 是近交系数,关于这个公式的推导可以看看孟浩巍的课,推到的很详细





不同的方法得到的结果大致相似
三. 群体结构和亲缘关系的使用
