GWAS分析

Habier2010 遗传关系信息对育种值的影响

2017-08-30  本文已影响31人  董八七

Habier D, Tetens J, Seefried F-R, et al (2010) The impact of genetic relationship information on genomic breeding values in German Holstein cattle. Genet Sel Evol 42:5. doi: 10.1186/1297-9686-42-5

抽象

背景
已经证明了单核苷酸多态性(SNPs)捕获的添加遗传关系对基因组育种值(GEBV)的准确性的影响,但最近对荷斯坦人群获得的数据的研究忽视了这一事实。然而,由于连锁不平衡(LD)的这种影响和GEBVs的准确性,这在几代人中相当持续,因此必须知道实施未来的育种计划。

材料和方法
用于调查这些问题的数据集包括3,863名德国霍尔斯坦公牛,基因型为54,001个SNP,其系数和产妇偏差为牛奶产量,脂肪产量,蛋白质产量和体细胞评分。交叉验证方法适用,其中,所述最大附加遗传关系(一个最大值在训练和验证公牛之间)被控制。GEBV通过贝叶斯模型平均法(BayesB)和使用基因组关系矩阵(G-BLUP)的动物模型估计。通过使用GEBV的精度和基于谱系的BLUP-EBV的准确性的回归方法来估计由LD引起的GEBV的准确性。

结果
Bayes B和G-BLUP获得的GEBVs的精度随着分析的所有性状的最大值的降低而降低。G-BLUP的精度衰减趋于较大,训练尺寸较小。贝叶斯B和G-BLUP之间的差异由于LD的准确性而变得明显,其中BayesB明显优于G-BLUP,训练规模越来越大。

结论
当前选择候选人的GEBV精度因相对于训练数据的不同加性遗传关系而变化。未来候选人的准确度可能低于以前的研究报告,因为在应用GEBV选择时,近亲的信息将不可用。贝叶斯模型平均方法利用LD信息比G-BLUP好得多,因此是最有希望的方法。交叉验证应考虑数据中的家族结构,以便在动物和植物育种中实现基于长期基因的育种计划。

背景

单核苷酸多态性(SNPs)的高通量基因分型的发展增强了使用全基因组密度标记数据进行家畜遗传改良。Meuwissen等 [ 1 ]提出了两步法预测基因组育种价值(GEBVs):首先,①使用表型为数量性状(训练)的基因型个体估计SNP效应,然后②通过仅使用仅预测任何基因型个体的GEBV其SNP基因型和估计的SNP效应。这种对GEBVs的预测和选择被称为基因组选择(GS)。

牛饲养者接受GS,从而减少产生间隔的潜力主要取决于GEBV的准确性假设没有模拟分离,仅当SNP和数量性状基因座(QTL)之间存在连锁不平衡(LD)时,GEBV准确度高于标准基于谱系的BLUP-EBV的准确度。LD在这里被定义为可用数据集中所有个体的不同位点处的等位基因状态之间的依赖关系。在连锁平衡的情况下,GEBV的准确度不一定为零,但随着模型中拟合的SNP数量的增加,将接近基于谱系的BLUP-EBV的准确性。原因是,如Habier等人所证实的,SNP捕获添加遗传关系,而不考虑人群中LD的量。[ 2 ]和Gianola等人 [ 3 ]。在这些研究中以及在这里,加性遗传关系被定义为Malécot给出的两倍的coancestry系数[ 4 ]。请注意,这并不要求培训人员是相关的,只有GEBV估计的个人才与培训人员有关。这在本文的附加文件1中有详细的说明。在实践中,存在LD在牛种群[ 5,6,7 ]并因此两种类型的信息被用来估计GEBVs:LD和添加剂的亲缘关系。如果建立分离,则可以使用第三种类型的信息。然而,在这项研究中并没有模拟出分离。GEBVs的几代精度的持久性,并且因此GS的潜力,以减少未来表型[ 8,9 ],在很大程度上取决于LD的量,这在远交种群来源于历史突变和漂移,共分离,迁移,选择和最近的漂移。在模拟中,Habier等 [ 2 ]估计仅由于LD(简而言之,LD的准确性)的GEBV的准确性,其显着小于由训练个体的后代的LD和加性遗传关系导致的GEBV精度,但是几代人相当持久。此外,通过用于估计SNP效应的统计学方法利用LD信息的能力各不相同。Meuwissen等 [ 1 ]提出了一种称为贝叶斯B的贝叶斯模型平均方法,其仅适用于马尔可夫链蒙特卡罗(MCMC)算法的每轮可用SNP中的一小部分,并且使用t分布式先验模拟SNP效应。他们进一步使用脊背回归BLUP(RR-BLUP),其适合所有SNP效应与正常的先验。Habier等人 [ 2 ]表明,贝叶斯B比RR-BLUP更能够利用LD信息,较少受加性遗传关系的影响。从真牛数据GEBVs的精度已经报道了来自北美[荷斯坦黑白花人口10 ],澳大利亚,荷兰和新西兰[ 11,12 ]。在这些研究中,GEBV的牛奶性能,生育力和功能特征的准确度范围为0.63至0.84,并且取决于训练数据的大小,遗传力和SNP密度。这些精度确认那些在模拟中发现[ 1,2,13,14 ]相当不错,但相比于只适合可用的SNP如BayesB的一小部分的方法RR-BLUP只稍微逊色。VanRaden等 [ 10 ]和Hayes等人 [ 12 ]得出结论,与大多数模拟结果不同,只有少数QTL具有很大的效应,许多具有很小的效应有助于遗传变异。然而,这些研究并没有显示GEBV准确性对加性遗传关系的依赖性,这是训练中的亲属数量,与培养个体的关系程度[ 2 ]和遗传力的函数。因此,训练尺寸减小的精度较低[ 10]可能是培训中亲属数量较少的结果,这意味着由于LD和GS方法获得更多持久的准确性,最有可能利用LD信息仍然需要对真实的牛数据进行评估。更重要的是,必须知道GEBV准确度对加性遗传关系的依赖性以及由于LD引起的准确性,因为开发未来的育种计划,因为当GEBV应用于选择时,后代进行数量性状测试的亲属可能不可用动物早期的生命。本研究的目的是分析训练和验证数据集之间的加性遗传关系对GEBV的准确性的影响,并估计在德国荷斯坦弗里斯兰人群中LD的准确性。因此,估计了当前和未来选择候选人以及与人口无关的个人的GEBV的准确性。此外,基于LD的准确性,BayesB和RR-BLUP的比较将显示哪种统计模型有可能减少未来的表型。

上一篇下一篇

猜你喜欢

热点阅读