CART树剪枝(二)
2018-04-16 本文已影响216人
只为此心无垠
一、剪枝理论基础
![](https://img.haomeiwen.com/i1670295/bbdc409196d0dbd6.png)
二、剪枝四部曲
- 1、代价函数复杂度
- 2、非叶子节点的表面误差率增益率(误差增加的速度)公式推导(代价函数负责度的差):当多个非叶子节点的α值同时达到最小时,取|NTt|最大的进行剪枝。计算表面误差率增益率
- 3、剪枝,得到一系列α的值和对应的子树序列T0,T1...
- 4、交叉验证,选取最优α
1、代价函数复杂度
![](https://img.haomeiwen.com/i1670295/563c8a59e84e876e.png)
2、表面误差率增益率:最难以理解的一步
![](https://img.haomeiwen.com/i1670295/81a60a5b47bd4806.png)
![](https://img.haomeiwen.com/i1670295/8ad61d1aea8bdda4.png)
3、剪枝
![](https://img.haomeiwen.com/i1670295/f1c155be80f1edd1.png)
4、交叉验证
![](https://img.haomeiwen.com/i1670295/bcb9a86787b28dfe.png)
三、参考
1、Cost-Complexity_Pruning
2、决策树的剪枝算法
3、CART剪枝详解
4、 cart树ccp剪枝详细介绍