Feature Scaling-特征缩放

2018-09-29  本文已影响0人  博士伦2014

特征缩放

机器学习项目中,我们需要应用于数据的最重要的转换之一是特征缩放。除了少数例外,当输入数字属性具有非常不同的比例时,机器学习算法表现不佳。住房数据就是这种情况:房间总数在6到39,320之间,而收入中位数的范围只有0到15.请注意,通常不需要缩放target values。有两种常用方法可以使所有属性具有相同的比例:min-max缩放和标准化

受特征缩放影响的算法

他们之所以受特征缩放的影响是因为他们都是根据距离数据的距离进行划分的。支持向量机划分是根据到数据点间的最大距离,K均值的选取和优化也和距离有十分密切的关系。因此,当一点的距离成倍增加时必然会对分类造成影响。

决策树之所以不受特征缩放影响是因为决策树总是横向的分割,即使某一个变量成比例的扩大倍数也没有关系。线性回归之所以不受影响的是因为线性方程的比例关系总是不变的,所以缩放对其没有影响。


上一篇 下一篇

猜你喜欢

热点阅读