GWAS理论 1-2 表型考察处理与标记开发和分型
一、表型鉴定与记录的基本原则和原始数据处理

基因型分型
基因型分型(英语:genotyping)是一个通过生物检定法检测某一个体的DNA序列,并对比参照其他个体的基因型或序列的过程,可用于显示该个体等位基因从其父母遗传而来的情况. 通常,基因型分型利用DNA序列定义群体信息,而不涉及定义该个体的基因。
1、各类性状的特点及鉴定与考察建议


2、表型的基本处理(第一步)






3、表型的基本分析(第二步)



遗传力
遗传力又称遗传率,指遗传方差在总方差(表型方差)中所占的比值,可以作为杂种后代进行选择的一个指标。遗传力分为广义遗传力和狭义遗传力。数量性状受到环境因素的影响很大,那么表型的变异可能有遗传的因素,也有环境的因素,甚至还有环境和遗传相互作用的因素。
性状影响
例如15℃时基因型AA的植物平均高度为40cm,而基因型Aa型的植物仅有35cm高;但是在30℃时情况就不同了,AA植株的平均高度为55cm,而Aa型植株反长得更高,为60cm。同一种基因型在不同的温度下表型不同,这一变异是由环境引起的,所产生的方差称环境方差(VE);在同样的温度下,不同基因型的高度不同,这一表型变异是遗传因子所引起的,所产生的方差称遗传方差。在任何的温度下,植物的表型既受到温度的影响,又受到遗传因素的影响,这种影响产生的方差称环境和遗传的协方差。
表型是由遗传和环境共同作用的结果,可以下式表示。
P=G+E
遗传力
若以方差表示:
对于一个表型的变异究竟是遗传因子起主要作用还是环境因子起主要作用呢?为了解答这个问题人们又引入一个概念叫遗传力(heritability)。遗传力表明某一性状受到遗传控制的程度。它介于0与+1之间,当等于1时表明表型变异完全是由遗传的因素决定的,当等于0时表型变异由环境所造成。
REML 方法
限制最大似然 (REML) 方法
这里是遗传方差

BLUP
最佳线性无偏预测(best linear unbiased prediction, 简称BLUP),是统计学上用于线性混合模型对随机效应进行预测的一种方法。随机效应的最佳线性无偏预测(BLUP)等同于固定效应的最佳线性无偏估计(best linear unbiased estimates, BLUE)
BLUP(best linear unbiased prediction)在育种中是指根据多次观测的结果,使用线性无偏估计的方法,去掉环境差异的影响,估计出由遗传因子决定部分,估计出的值我们常称为育种值(Estimated breeding value,EBVs),相比于均值,EBVs去除了环境差异导致的差异,所以更能代表该性状。但如果我们需要考虑基因型与环境互作时(G by E),则应该用多年多点观测的结果分别分析然后综合比较。
其他相关解释
关于BLUP方法的几点说明
动物育种核心算法BLUP介绍(公式版)
二、标记的开发和分型



现在已经不推荐使用基因型填补了
非人类数据针对called genotype常用的方是KNN(就是根据附近K个位点的信息进行填补),最近用在低深度重测序中的是stitch(https://github.com/rwdavies/STITCH),想了解具体原理可以看对应的文献。一般填补是用在大样本极地深度的测序项目中,现在测序一般都能测5-10X,这个深度对于比较纯的自交系来说,这个深度已经不算低了,对于杂合位点比例比较高的群体材料,这个深度可能不够,但是填补也不准确。


在水生动物里面基本不用,杂合较多。

水生动物就需要选择 10X

哈迪-温伯格定律
“哈迪-温伯格定律”是指在理想状态下,各等位基因的频率在遗传中是稳定不变的,即保持着基因平衡。该定律运用在生物学、生态学、遗传学。条件:①种群足够大;②种群个体间随机交配;③没有突变;④没有选择;⑤没有迁移;⑥没有遗传漂变。
例如:当等位基因只有一对(Aa)时, 设基因A的频率为 p,基因a的频率为q,则A+a=p+q=1,AA+Aa+aa=p2+2pq+q2=1 。哈迪-温伯格平衡定律(Hardy-Weinberg equilibrium) 对于一个大且随机交配的种群,基因频率和基因型频率在没有迁移、突变和选择的条件下会保持不变。