统计分析与数据挖掘

统计学(74)-识别回归模型的好坏

2020-04-10  本文已影响0人  Zhigang_Han
1. 残差-识别回归模型好坏的关键

定义:在样本数据中,对均值估计的表达式和对观测值的表达式的差异可以用图2来表示。点(观测值)和回归线(平均值),二者的差别称为残差。注意残差与误差项不同,残差是样本数据中的,可以视为对总体模型中误差项的估计。
示例解读:

图1.数据集
图2.观测值与回归线
(1)图中样本估计值和样本观测值的差值就是残差。每个点都与估计值有一个差值,因此12个点就有12个残差。很明显,残差越小,说明拟合的回归模型越好,因为它更贴近实际值。
(2)现实中,我们会更关心回归系数的大小,但残差却能告诉我们这些系数的估计值是否可靠。
2. 怎样去看残差图?
线性回归与残差
(1)如在(a)图中,差值有上有下,反映在(b)图中就是围绕0随机波动的几个点。
总结:一条对数据点拟合好的回归线必然穿过这些点的中央,所有的点围绕这条线随机波动,反映在残差中就应该是围绕0随机波动,不应该有任何趋势。如果残差能看出趋势,则说明模型拟合肯定有问题。
总之残差是判断回归模型的关键
上一篇下一篇

猜你喜欢

热点阅读