教你用Python来计算偏差-方差权衡
2021-04-22 本文已影响0人
you的日常
衡量一个机器学习模型的性能,可以用偏差和方差作为依据。
一个高偏差的模型,总是会对数据分布做出强假设,比如线性回归。而一个高方差的模型,总是会过度依赖于它的训练集,例如未修剪的决策树。我们希望一个模型的偏差和方差都很低,但更多情况下我们需要在二者之间做出权衡。
在选择和调整模型时,“偏差-方差权衡”
是一个非常有用的概念。当然它在一般情况下是无法直接计算的,因为这需要这一问题领域内的全部知识,而我们并不具备。尽管如此,我们可以评估出一个模型的误差,并将其拆分成偏差和方差两部分,从而借此了解该模型的运行方式。
在这篇教程中,你将了解如何计算一个机器学习模型的偏差和方差。
在完成这篇教程后,你将会学到:
- 模型误差包含模型方差、模型偏差以及不可约误差;
- 我们希望模型具有低偏差和低方差,但是一般情况下一个值的缩小会导致另一个值的增大;
- 如何将均方误差分解成模型的偏差和方差。
教程综述