数据蛙数据分析每周作业

数据预处理

2019-02-28  本文已影响1人  怀柔小龙虾

数据预处理是在各类算法的使用前对数据进行一定的操作,让数据能在训练中得到更好的使用效果,而数据有很多种,如连续型特征数据,分类型的特征数据(也称离散型)等等,因此预处理有很多种方法,依次可分为以下几种:

在介绍这些方法的开头,为了方便,先将某大佬的经验总结贴在这里:


Standardization,or mean removal and variance scaling(标准化、去均值和方差按比例缩放)


Non-linear transformation(非线性转换)


Normalization(归一化,也称正则化)


Feature binarization(特征二值化)


Encoding categorical features(分类特征编码)


Imputation of missing values(缺失值插补)


Generating polynomial features(生成多项式特征)


Custom transformers(自定义转换器)


参考资料:
【1】Preprocessing data(sklearn官方文档)
【2】预处理数据(sklearn中文文档)
【3】预处理数据的方法总结(使用sklearn-preprocessing)

上一篇下一篇

猜你喜欢

热点阅读