01-11
2019-01-11 本文已影响0人
姬汉斯
今天看的是数据清洗部分,将其中一些无用的繁杂数据予以清除,便于后续整理,提高最后结果的质量。依然是利用之前的pandas工具,比如使用规范化语句统一单位,定义标签用于抛弃无用数据,用平均值进行模拟缺失值。但是实际操作中还出会出现错误,在寻找原因。
今天看的是数据清洗部分,将其中一些无用的繁杂数据予以清除,便于后续整理,提高最后结果的质量。依然是利用之前的pandas工具,比如使用规范化语句统一单位,定义标签用于抛弃无用数据,用平均值进行模拟缺失值。但是实际操作中还出会出现错误,在寻找原因。