遗传改良(育种)GWAS分析群体遗传学

Chang2016 大豆 GWAS&GS

2018-11-09  本文已影响4人  董八七

Chang H-X, Brown PJ, Lipka AE, et al. Genome-wide association and genomic prediction identifies associated loci and predicts the sensitivity of Tobacco ringspot virus in soybean plant introductions. BMC Genomics, 2016, 17(1): 153. DOI: 10.1186/s12864-016-2487-7.

全基因组关联和基因组预测鉴定相关基因座并预测烟草环斑病毒在大豆植物引入中的敏感性

摘要

背景

全基因组关联研究(GWAS)是检测和表征目标性状的有用工具,包括与大豆抗病性相关的性状。在USDA大豆种质收集中对19,652个大豆和野生大豆植物引入(PI)的50,000个单核苷酸多态性(SNP)标记(SoySNP50K iSelect BeadChip)的可用性允许快速且稳健地鉴定与期望的表型相关的基因座。通过使用全基因组标记集来预测表型值,表型 - 未知但基因型确定的PI的基因组预测已成为可能。本研究的目的是描述与美国农业部大豆种质收集中的感染烟草环斑病毒(TRSV)敏感性相关的遗传结构。

结果

697个大豆PI的TRSV诱导的疾病敏感性评定为1至5级,其中植物评定为表现出轻微症状的植物,并且植物评定为5个显示末端芽坏死(即芽枯病)。GWAS鉴定了大豆染色体2上与TRSV敏感性强烈相关的单个基因座。交叉验证显示相关系数为0.55(P<0.01)至TRSV灵敏度,不包括来自GWAS的最重要的SNP标记作为协变量,与通过使用显着SNP的平均分离相比,这是更好的估计。使用GAPIT R包获得了USDA大豆种质收集中剩余的18,955个未筛选大豆PI的基因组估计育种值。为了评估预测准确性,另外55个大豆种质被评估对TRSV的敏感性,这导致 实际和预测的严重性之间的相关性为0.67(P <0.01)。

结论

在染色体2上鉴定了负责大豆中TRSV敏感性的单个基因座。两个富含亮氨酸的重复受体样激酶基因位于基因座附近并且可以控制大豆对TRSV感染的敏感性。此外,完成了对USDA大豆种质收集中所有种质的TRSV敏感性的综合基因组预测。

引言

全基因组关联研究(GWAS)是一种统计分析,它将整个基因组的变异与表型联系起来[9,10]。 在大豆的情况下,GWAS已被用于鉴定与农艺性状相关的基因座[11],非生物胁迫[12]和抗病性,包括疫霉根腐病(Phytophthora sojae Kaufman&Gerdman)[13],核盘菌腐病(Sclerotinia) sclerotiorum(Lib。)de Bary)[14,15,16],大豆胞囊线虫(Heterodera glycines Ichinohe)[17,18,19]和猝死综合症(Fusarium virguliforme Akoi,O'Donnell,Homma&.Lattanzi)[20]。 随着SoySNP50K单核苷酸多态性(SNP)标记的可用性[21],USDA大豆种质收集中超过19,000份种质的基因组信息可用于鉴定许多性状的基因,包括对TRSV的抗性或耐受性。

方法

GWAS和基因组预测

基于BIC的模型选择过程中使用5个PC,该过程确定在用于GWAS的统一混合线性模型中需要多少PC来控制种群结构。 使用均值和平均聚类算法通过VanRaden方法计算亲属矩阵[24]。 GWAS是在GAPIT中使用统一的混合线性模型进行的,包括亲属矩阵但不包括PC【为什么?】 [25]。 GWAS中包括总共697个针对TRSV症状敏感性的大豆PI(附加文件2:表S2)。 鉴于在GWAS中校正多个测试的固有保守性,实施了两个多个测试程序。 使用Benjamini-Hochberg(1995)程序将FDR控制在1%,并且实施Bonferroni程序以将实验方式的I型错误率控制在0.05。 为了搜索任何可能的次要信号,最重要的SNP(ss715581043)被固定为协变量【不了解】。
为了确定标记辅助选择是否可以预测TRSV敏感性,697个大豆PI中每个显着SNP的数字基因型与它们的敏感性相关。【交叉验证】为了确定基因组选择是否可以预测TRSV敏感性,使用GAPIT和rrBLUP测试了模型中有或没有协变量的五重交叉验证。在每次五重交叉验证中,将140个大豆PI分配给验证群体,并将剩余的557个大豆PI用作培养群体以构建模型。 697个大豆PI的每次加入作为验证群体分配一次,进行五次交叉验证。每个五倍交叉验证的平均值,即从训练模型生成的验证群体的BLUP与验证群体的TRSV灵敏度之间的相关性,作为五倍交叉验证的结果被保存。对随机化的697个大豆PI进行总共100次5次交叉验证,每次运行。使用相同的五倍来评估GAPIT和rrBLUP中使用的基因组预测模型的预测准确性。提出100次迭代的平均值来表示GAPIT和rrBLUP的结果。
为了评估美国农业部大豆种质收集中剩余的18,955个未筛选大豆PI中基因组预测的预测准确性(附加文件1:表S1),将这些PI随机分成85组,每组223个PI,以减少计算时间。为了预测未筛选组的GEBV,将每组的基因型与697个筛选的PI的基因型组合以适合GAPIT中的基因组预测模型;因此,拟合了85个独立的基因组预测模型,为18,955个PI中的每一个获得一个GEBV。对18,955个未筛选的大豆PI中的每一个进行了总共10次运行,并且使用平均值来表示每个PI的GEBV。为了近似基因组预测准确性,从18,955个未筛选的大豆品种中选择总共55个大豆PI,并按照上述方法对其实际TRSV敏感性进行表型分析。如上所述进行交叉验证以获得预测的GEBV与这55个种质的实际灵敏度之间的平均相关性,其被认为是基因组预测的预测准确度。

上一篇下一篇

猜你喜欢

热点阅读