机器学习基石笔记:13 Hazard of Overfittin
2019-05-01 本文已影响8人
cherryleechen

引起过拟合的原因有:
- 过度VC维(模型复杂度高) ------ 确定性噪声;
- 随机噪声;
- 有限的样本数量
。


通过具体实验来看模型复杂度/确定性噪声、随机噪声
、样本数量
对过拟合的影响:




避免过拟合的常用方法:
- 从简单模型开始:降低模型复杂度;
- data cleaning/data pruning:去noise;
- data hinting(线索):增加样本数量;
- regularization:正则化;
- validation:验证。

