机器学习

数据清洗

2019-04-24  本文已影响0人  凌霄文强

数据类型转换

冗余数据处理

缺失值处理

异常值处理

异常情况 判断方法
异常点 x>Q3+1.5(Q3-Q1)或者x<Q1-1.5(Q3-Q1)
极端异常点 x>Q3+3(Q3-Q1)或者x<Q1-3(Q3-Q1)
异常情况 判断方法
异常点 均值的2标准差邻域之外
极端异常点 均值的3标准差邻域之外
上一篇下一篇

猜你喜欢

热点阅读