用Excel的框架去学pandas(数据清洗)
2017-05-01 本文已影响284人
成鹏9
处理空值
Excel方法
在Excel中,碰到空值的时候直接可以通过定位空值之后然后进行统一改动。

Pandas方法
dropna把带有空值的行全部去除。

fillna对空值进行填充。

清理字符串中的空格
Excel方法
Excel中可以通过替换的方法去除字符串中的空格。
Pandas方法
利用str.strip函数可以去除字符串中两边的空格(中间的空格不能去除)。

大小写转换
Excel方法
Excel中我可以通过UPPER和LOWER函数对字符串进行大小写转换。
Pandas
pandas也有同名的函数可以用用来大小写转换。

更改数据格式
Excel方法
Excel更改数据格式可以通过这个地方进行更改。

Pandas方法
用astype函数更改数据格式。

提示:最好先把缺失值处理好才进行格式转换。
更改列名称
Excel方法
直接在更改列标题即可。
Pandas方法
用rename函数进行更改,里面的内容用字典的方式展示。

删除重复项
Excel方法

Pandas方法

数值修改和替换
Excel方法

Pandas方法
