程序员机器学习与数据挖掘

机器学习实战-数据探索(变量变换、生成)

2017-10-07  本文已影响2250人  jacksu在简书

1 变量变换

1.1 什么是变量变换?

在数据建模中,变换是指通过函数替换变量。 例如,通过平方/立方根或对数x替换变量x是一个变换。 换句话说,变换是一个改变变量与其他变量的分布或关系的过程。

1.2 什么时候需要变量变换?

Transformation_1.png

1.3 变量变换的常用方法是什么?

变换变量有许多方法,如平方根,立方根,对数,合并,倒数等等。来看看这些方法的细节和利弊。

2 生成特征

生成特征是基于现有特征生成新特征的过程。 例如,将日期(dd-mm-yy)作为数据集中的输入特征,可以生成新特征,如日,月,年,周,工作日,可能与target有更好的关系。 此步骤用于突出显示变量中的隐藏关系。

Derived.png

2.1 生成特征的类别

Dummy.png

2.2 生成特征的常用方法

参考

5 Simple manipulations to extract maximum information out of your data

上一篇 下一篇

猜你喜欢

热点阅读