52 - 基因组预测的基础(5)— LR 方法的理论和实践
2022-09-13 本文已影响0人
Hello育种
LR方法创建者:Legarra, A., Reverter, A., 其发表在GSE期刊:https://gsejournal.biomedcentral.com/articles/10.1186/s12711-018-0426-6。
动物育种值估计时有风险的,并不是百分之百准确。
交叉验证(cross-validation)- 以前经常使用的方法
一般步骤:
image.png
但是应该怎么划分数据?
image.png
都有各自的缺点:
例如向前交叉验证;
image.png
指标(Metrics)
image.png
真实和估计遗传进展, 为什么查看b0 和b1:
image.png
b0
image.png
b1
image.png
我们应该怎做交叉验证?
image.png
因为遗传变异的减小,使用预测力(predictability)会低估准确性
image.png
例如:
image.png
因为忽略固定效应的误差,使用预测力(predictability)会高估准确性
image.png
实际中我们以前怎么做的交叉验证:
image.png
新方法: LR
image.png
image.png
LR方法怎么工作?
image.png
确定focal群体
image.png
指标
image.png
例子求解(R):
image.png
新的指标——准确性(相对估计量):
image.png
已经经过选择的可靠性:
image.png
未经过选择的可靠性:
image.png
例子文章:使用 BLUP 和 SSGBLUP 对元创始人和未知父组进行奶羊评估的偏差和准确性
image.png
定义focla群
image.png
定义“整体“和"部分”数据集。
image.png
需要学会awk和shell语句帮助自动化工作
例如:
image.png
实践中对于部分数据集的处理
image.png
参考相同的遗传基础
image.png
基因型数据(genomic)VS 系谱
总共四次估计
image.png
比较不同的模型
image.png
一些结果
from: Fernando Macedo, 在法国对奶绵羊的育种。
image.png
基础群体:
image.png
法国奶羊的基因分型:
image.png
结果
image.png
image.png
例子文章:删除数据并使用元创始人减轻了 Lacaune 奶羊预测中所有性状的偏差
主要内容:
image.png
主要结果:
偏差(bias):
image.png
斜率(slope):
image.png
其他:
image.png
image.png
奶绵羊的主要结论:
image.png
LR方法是假设模型正确
模拟
image.png
结果:
image.png
image.png
image.png
结论
image.png
总结
image.png
image.png