实用机器学习---笔记(数据处理)

2018-01-09  本文已影响0人  liz0403

机器学习首先需要做好数据处理。

1.数据收集

2.重点特征的确认

3.数据规范化:

分类特征不要使用位操作来表现一个种类;最好一个分类一个数据

缺失的数据,可新定义一个新类、可根据附近数据来设置新指、可用整体数据的平均值、中位值等代替。

要注意从原有特征中细化新的有用的特征

要将数据规划到合适区间(如-1到1,0到1等)

4.通过数据可视化来缺点特征是否有意义

分类型数据可用马赛克图或盒图

数值数据可用密度图或散点图

上一篇 下一篇

猜你喜欢

热点阅读