Da2014 显性 奶牛
Da Y, Wang C, Wang S, Hu G (2014) Mixed model methods for genomic prediction and variance component estimation of additive and dominance effects using SNP markers. PLoS One. doi: 10.1371/journal.pone.0087666
摘要
我们建立了一个具有基因组加性和显性关系的数量性状基因组模型,该模型与传统的数量遗传学模型相似,将基因型值划分为育种值和显性偏差,并利用系谱信息计算加性和显性关系。基于这个基因组模型,我们发展了两套计算互补但数学上完全相同的混合模型方法,用于利用SNP标记对加性和显性效应进行基因组最佳线性无偏预测(GBLUP)和基因组限制最大似然估计(GREML)。这两个集合被称为CE和QM集合,其中CE集合是为大量标记设计的,QM集合是为大量个体设计的。训练和验证数据集中的个体的GBLUP和相关准确度公式是从育种值、显性偏差和基因型值中导出的。模拟研究表明,GREML和GBLUP一般都能捕获小的加性和显性效应,每个加性和显性效应占表型方差的0.00005-0.0003,GREML能够区分真实的加性和显性遗传力水平。总遗传值的GBLUP作为加性效应和显性效应的总和,比加性效应和显性效应的GBLUP具有更高的预测精度,因果变异的GREML和GBLUP的预测精度最高,预测精度与观测精度一致。使用SNP标记的基因组加性和显性关系矩阵符合理论预期。GREML和GBLUP方法可作为评估影响表型的遗传效应类型和程度以及预测整个基因组水平上的总遗传值的有效工具。
介绍
利用全基因组单核苷酸多态性(SNP)标记进行基因组预测已被证明是捕获散布在基因组上的小遗传效应的有力工具,用于预测个体表型的遗传潜力[1-5]。目前大规模的基因组预测主要集中在加性效应[2,4,5]。描述了两种用于加性效应基因组预测的SNP模型:传统的定量遗传学模型和(21)-0-1snp编码模型[2]。传统的数量遗传学模型很有吸引力,因为它与传统的动物模型相当,关系矩阵由SNP基因型计算而来[5],它直接预测基因组育种值[2,4,5]。方法和计算工具可用于使用全基因组SNP标记估计基因组遗传力[6]。该方法使用了0-1-2加性编码的标准化,该标准化的减法步骤导致了加性效应,在传统的数量遗传学模型下,假设Hardy-Weinberg平衡[2,6,7]。这种方法的混合模型实现对于大量的标记是理想的,但是对于大量的个体不是理想的,因为需要反转的矩阵的大小随着个体数量的增加而增加。
从缺失遗传力[8-10]的角度来看,估计全基因组显性贡献的能力将有助于确定表型的总遗传贡献。同样,考虑显性的基因组预测方法可以预测个体受加性和显性效应影响的表型的总遗传潜力。显著的显性效应应该证明在基因组预测和交配系统的设计中包含显性效应是合理的,以使显性效应最大化。在奶牛中,根据系谱数据估计的优势方差为身高表型方差的11-16%[11],具有表型和基因型的奶牛的增加提供了一个机会来估计优势效应,并将其纳入交配计划[12]。然而,关于显性的基因组预测和方差分量估计的方法学研究有限[13-16]。
基因组最佳线性无偏预测(GBLUP)和各种贝叶斯方法可用于基因组预测,且GBLUP在实际数据中通常具有良好的性能[17]。限制极大似然估计(REML)[18]是一种广泛接受的估计方差分量的方法。
本研究的目的是在传统的将基因型值划分为育种值和显性偏差的数量遗传学模型的基础上,发展混合模型方法,用于加性效应和显性效应的联合基因组预测和方差分量估计。该方法将为大量个体和标记提供两种互补的计算策略,并为have-GBLUP提供基因组预测方法以及训练和验证数据集的相关可靠性。新方法的准确性将使用基于真实奶牛SNP结构的模拟数据进行评估。