方差偏差

2020-03-27 本文已影响0人 inspiredhss

image.png

[高方差] 采集更多的样本数据
[高方差] 减少特征数量，去除非主要的特征
[高偏差] 引入更多的相关特征
[高偏差] 采用多项式特征
[高偏差] 减小正则化参数 λ
[高方差] 增加正则化参数 λ

训练集和交叉验证集的误差曲线来直观地理解高偏差与高方差的意义

多项式回归，当次数选取较低时，我们的训练集误差和交叉验证集误差都会很大；当次数选择刚好时，训练集误差和交叉验证集误差都很小；当次数过大时会产生过拟合，虽然训练集误差很小，但交叉验证集误差会很大

image.png

所以我们可以计算 Jtrain(θ)Jtrain(θ) 和 Jcv(θ)Jcv(θ)，如果他们同时很大的话，就是遇到了高偏差问题，而 Jcv(θ)Jcv(θ) 比 Jtrain(θ)Jtrain(θ) 大很多的话，则是遇到了高方差问题。

对于正则化参数，使用同样的分析方法，当参数比较小时容易产生过拟合现象，也就是高方差问题。而参数比较大时容易产生欠拟合现象，也就是高偏差问题。

image.png

学习曲线都是一个十分直观有效的工具。学习曲线的横轴是样本数，纵轴为训练集和交叉验证集的误差。所以在一开始，由于样本数很少，Jtrain(θ)Jtrain(θ) 几乎没有，而 Jcv(θ)Jcv(θ) 则非常大。随着样本数的增加，Jtrain(θ)Jtrain(θ) 不断增大，而 Jcv(θ)Jcv(θ) 因为训练数据增加而拟合得更好因此下降。所以学习曲线看上去如下图：

image.png

高偏差：

image.png

高方差：

image.png

方差偏差

猜你喜欢

热点阅读