sklearn-回归mse和friedman_mse

2020-08-30  本文已影响0人  ab02f58fd803

sklearn函数库中在基于决策树(主要是CART)的一些算法(decision tree regression, randomforest, extra randomized tree, gradient boosting regression tree等)中做回归时,在构建二叉CART的过程中要进行特征的选择最佳决策值的选择,回归主要使用的损失函数标准是['mse', 'friedman_mse','mae']。这里对mse'friedman_mse'做一个区分。

1.mse-mean squared error impurity criterion(均方误差不纯度准则)

MSE = var_left + var_right

这里指的是左子树的方差与右子树的方差之和

2. friedman_mse-mean squared error impurity criterion with improvement score by Friedman(Friedman改进的均方误差不纯度准则)

 diff = mean_left - mean_right
 improvement = n_left * n_right * diff^2 / (n_left + n_right)

这里mean_left/right 指的分别是左右子树的平均误差,n_left/right分别是左右子树的样本数目。

详见sklearn criterion

上一篇 下一篇

猜你喜欢

热点阅读