Python数据分析

7、pandas设置和修改索引,计数,多表交叉合并

2017-12-10  本文已影响0人  让数据告诉你

现有一个现成的表格,是从EXCEL中读取出来的,已经带有序号这一列,我们需要将序号这一列改为索引,这就需要用到set_index()函数。

源数据 更改行索引

当然也可以只在在读取数据的时候进行索引的设定:

直接用index_col参数设定索引

也可以继续使用新的序列作为新索引,修改了之后原来的索引就默认删除了:

新索引

有时,我们需要知道这个表有多少行,比如:需要在表最后再添加一行的时候,.count()能将每列多少行一起返回。

计算行数

如果我们只需要一个数字,那我们就从中挑一列来计数就可以了。

指定列计算行数

在表后面添加一行,只需要用到前面文章中用到的选取行数据,再赋值就行了(根据索引是否从0开始,决定.count()后面是否要加1)。

加数据添加行(列表)

如果在循环中进行此操作,就可以完成:将多个表格穿插合并成一个表格,也可以通过计算得出新的行,再合并到旧的表格中,比如有两个表df和df2:

df2

先新建一个DataFrame, 将其中一个表的列名复制:

新建表的列名

将两个表的索引修改一下:

表1索引 表2索引

然后迭代:

合并两个表

就这样就交叉起来了(for循环计算会比较慢)。

上一篇 下一篇

猜你喜欢

热点阅读