python小白联盟numpy&pandas&matlaplib

尝尝pandas(3)

2018-08-24  本文已影响2人  雨路浅歌

大家好,今天给大家带来的内容是行列的增删和对缺失值的处理。

行列的增删

为了演示方便,而且考虑到后面要对缺失值进行处理,我创建一个含有缺失值的表格。

我们使用reindex方法来对行列进行处理,它可以对行列进行修改、增加和删除,返回的是一个DataFrame格式的副本。

将行索引重新修改为['a','b','c','d','e','g'],注意这里不是简单地将'f'换成'g',而是把'f'一整行换成索引名称为"g"的全缺失值行。需要注意的是df并没有发生改变。

另外一种方法是先把索引的名称写出来,然后再指定要替换的是行还是列,行为"index"/0,列为"columns"/1。

虽然reindex方法看起来好像是为行索引而设置的方法,但是它也使用与列索引。

删除相关行和列,或者更准确地说是保留相关行和列。

增加一列

上面我们看到了,缺失值都是使用NaN来代替,其实我们也可以指定fill_value的值来换成我们喜欢的值。

缺失值处理

把所有缺失值换成6

把列索引名称为4的那一列的缺失值换成'python',如果该列没有缺失值,则无变化。

把缺失值替换成缺失值后面的值,因为axis的默认值0,即沿着行替换,所以这里的"后面"默认为是"下面"。

与bfill相反,把缺失值替换成缺失值前面的值,这里的"前面"默认为"上面"。

除此之外,我们还可以指定替换的个数,注意这里的个数并不是指替换全部缺失值中的一个,而是指相连接的多个缺失值的一个。

我们还可以改变axis的值,使其可以沿着列替换缺失值,即"上面"对应"左边","下面"对应"右边"。

查看位置是否为缺失值,返回一个布尔表格。

今天的内容就是这些,咱下期再见,好心情!!!

上一篇 下一篇

猜你喜欢

热点阅读