呆鸟的Python数据分析我爱编程数据分析技术帖

用Excel的框架去学pandas(数据清洗)

2017-05-01  本文已影响284人  成鹏9

处理空值

Excel方法

在Excel中,碰到空值的时候直接可以通过定位空值之后然后进行统一改动。

定位空值后处理空值

Pandas方法

dropna把带有空值的行全部去除。

dropna

fillna对空值进行填充。

fillna

清理字符串中的空格

Excel方法

Excel中可以通过替换的方法去除字符串中的空格。

Pandas方法

利用str.strip函数可以去除字符串中两边的空格(中间的空格不能去除)。

清除空格

大小写转换

Excel方法

Excel中我可以通过UPPER和LOWER函数对字符串进行大小写转换。

Pandas

pandas也有同名的函数可以用用来大小写转换。

lower

更改数据格式

Excel方法

Excel更改数据格式可以通过这个地方进行更改。

更改数据格式

Pandas方法

用astype函数更改数据格式。

更改数据格式

提示:最好先把缺失值处理好才进行格式转换。

更改列名称

Excel方法

直接在更改列标题即可。

Pandas方法

用rename函数进行更改,里面的内容用字典的方式展示。

更改列名

删除重复项

Excel方法

删除重复项

Pandas方法

删除重复项

数值修改和替换

Excel方法

查找和替换

Pandas方法

替换
上一篇下一篇

猜你喜欢

热点阅读