2020-04-01 二手车交易价格预测 task3 建模与调参
2020-04-01 本文已影响0人
陶龙_c687
总结一:为了得到和SVD一样的投射,需要在PCA中将数据转换成零均值。
总结二:L1范数和L2范数均可以降低过拟合风险;
L1正则化值是模型中各个参数绝对值之和;
L2正则化表示各个参数平方和的开方值;
引入L2范数防止过拟合,被称为岭回归,将L2范数换成L1范数后,称为LASSO;
L1和L2范数均有助于降低过拟合风险,但L1范数更易获得稀疏解,即具有更少的非零分量。
总结三:过拟合表现为高方差,低偏差;
欠拟合表现为低方差,高偏差。
总结四:k折交叉验证不是k越大,就越好,大的k值会增加评估时间;
更大的k值意味着更小的偏差,因为训练集更加接近总数聚集;
选择k值时,要最小化数据集之间的方差。
总结五:可以有效解决过拟合的方法:增加样本数量;通过特征选择减少特征数量;正则化。