呆鸟的Python数据分析python我爱编程

数据预处理(pandas and sklearn)

2018-03-24  本文已影响240人  言文彡

使用python的pandas和sklearn库对数据进行预处理

数据

参考https://blog.csdn.net/u011094454/article/details/77618604

读取和显示部分数据

数据读取和展示

显示数据的部分信息

数据信息

显示所有列的介绍

数据信息

显示缺失信息

数据统计

统计缺失特征

数据统计

统计缺失特征(百分比)

数据统计

缺失值处理

填充

data[column_name].fillna(value)

忽略

data = data.drop(['column_name', axis=1]) //忽略列

data = data.drop(data[data['column_name'].isnull()].index) // 忽略行

去掉重复行

data.drop _duplicates()
上一篇 下一篇

猜你喜欢

热点阅读