MegaLMM结合表型组(数千性状)在动物遗传育种应用探索
研究流程图
![](https://img.haomeiwen.com/i24959989/bf3d9accab062af6.png)
摘要
背景
随着动物表型组学(遥感等)和深度表型(多组学数据)分析的快速发展,可以从每个个体获得数千种传统(但也有分子)表型。然而,在动物育种方面,如何处理如此大量的数据仍然缺乏探索,而这一挑战在未来可能会越来越严重。
研究目前
-
(1)探索超大规模线性混合模型(MegaLMM)的使用,这是一种基于因子模型的方法,能够同时估计数千种乳用性状(以下称为千性状(TT)模型)的(协)方差分量和遗传参数;
-
(2)比较单一性状(ST)和 TT 模型中焦点性状(即作为预测目标的性状,与有助于评估的次要性状相比)的表型值和基因组育种值( u )预测值;
-
(3)提出一种使用 TT 模型和 MegaLMM 预测GEBV( U )的新近似方法。
数据和算法
- 使用了从 3,302 头荷斯坦奶牛身上收集的总共 3,421 个牛奶中红外 (MIR) 光谱波点(称为次要性状)和 3 个焦点性状(平均脂肪百分比 [AFP]、平均甲烷产量 [ACH4] 和平均 SCS [ASCS])。
- 3,421 个牛奶 MIR 波点性状由 11 个类别(泌乳月份)的 311 个波点组成。
- 所有动物的 564,439 个 SNP 的基因分型信息均可用,并用于计算基因组关系矩阵(G矩阵)。
- MegaLMM 是在贝叶斯稀疏因子模型框架内实施的,并通过吉布斯抽样(马尔可夫链蒙特卡洛)求解。
结果
-
所研究的 3,421 个牛奶 MIR 波点的遗传力在整个泌乳期以 311 个波点为单位逐渐增加然后降低。
image.png
-
前 311 个波点与其余 3,110 个波点之间的遗传和表型相关性较低。
image.png
-
ST 模型对 AFP(0.51 vs. 0.93)、ACH4(0.30 vs. 0.86)和 ASCS(0.14 vs. 0.33)的表型预测准确度低于 TT 模型。AFP(0.59 vs. 0.86)、ACH4(0.47 vs. 0.78)和 ASCS(0.39 vs. 0.59)的 u 预测准确度也呈现出相同趋势。
image.png
-
TT模型预测的U与新提出的近似方法之间的平均相关性为 0.90。
image.png
结论
-
用于估计MegaLMM 中U的新近似方法将提高 MegaLMM 在动物育种应用中的适用性。
-
该研究对表型组数据(数千种性状)在动物育种中的应用进行了初步研究,表明TT模型有利于预测焦点性状(表型和育种值),特别是对于难以测量的性状(例如ACH4)。
参考文献:
Exploring a Bayesian sparse factor model-based strategy for the genetic analysis of thousands of mid-infrared spectra traits for animal breeding