机器学习

交叉验证-原理

2018-06-04  本文已影响3人  灵妍
k包交叉验证.PNG

我们在实际建模时,有些参数是超参数,比如随机森林的决策树的个数等,这些超参数如何决定更好。
我们通常建立一个模型是将所有数据分为训练集和测试集,分的比例是1:3或者1:4,但是这是随机划分的,模型的好坏与划分出的测试集非常有关系,如果测试集方差比较大,差异比较大,我们可能测试的模型准确率就不高。
如何避免由于测试集划分的随机性导致的检测出来的模型准确率并不准确地问题呢。
这里我们将数据集划分为10组,每组划分为10份,选最后一组的最后一份到第一组的第一份作为测试集,训练10个模型,得出每组模型预测的混淆矩阵和预测准确率,最后求出十个模型的平均预测准确率作为该模型的分类准确率。
10iterations
10folds

上一篇 下一篇

猜你喜欢

热点阅读