52 - 基因组预测的基础(5)— LR 方法的理论和实践
2022-09-13 本文已影响0人
Hello育种
LR方法创建者:Legarra, A., Reverter, A., 其发表在GSE期刊:https://gsejournal.biomedcentral.com/articles/10.1186/s12711-018-0426-6。
动物育种值估计时有风险的,并不是百分之百准确。
交叉验证(cross-validation)- 以前经常使用的方法
一般步骤:

但是应该怎么划分数据?

都有各自的缺点:
例如向前交叉验证;

指标(Metrics)

真实和估计遗传进展, 为什么查看b0 和b1:

b0

b1

我们应该怎做交叉验证?

因为遗传变异的减小,使用预测力(predictability)会低估准确性

例如:

因为忽略固定效应的误差,使用预测力(predictability)会高估准确性

实际中我们以前怎么做的交叉验证:

新方法: LR


LR方法怎么工作?

确定focal群体

指标

例子求解(R):

新的指标——准确性(相对估计量):

已经经过选择的可靠性:

未经过选择的可靠性:

例子文章:使用 BLUP 和 SSGBLUP 对元创始人和未知父组进行奶羊评估的偏差和准确性

定义focla群

定义“整体“和"部分”数据集。

需要学会awk和shell语句帮助自动化工作
例如:

实践中对于部分数据集的处理

参考相同的遗传基础

基因型数据(genomic)VS 系谱
总共四次估计

比较不同的模型

一些结果
from: Fernando Macedo, 在法国对奶绵羊的育种。

基础群体:

法国奶羊的基因分型:

结果


例子文章:删除数据并使用元创始人减轻了 Lacaune 奶羊预测中所有性状的偏差
主要内容:

主要结果:
偏差(bias):

斜率(slope):

其他:


奶绵羊的主要结论:

LR方法是假设模型正确
模拟

结果:



结论

总结

