工作生活

pandas数据结构的Series

2019-07-06  本文已影响0人  践行数据分析

用python做数据分析离不开pandas,它有两个非常重要的数据结构:Series,DataFrame

先学习Series,Series可以看做是一维数组,它是有一组数据和一组与之对应的一组索引组成。

例如:

从上面看出series表现形式是 左边是索引index  右边是值value,在demo中我并没有指定索引,会自动创建索引从0 到 N-1 ,

可以通过series的values  和index的属性获取数组的表现形式和索引对象

通过索引取某个值或一组值,

定义serise的时候也可以指定索引名,例如:值2,4,6,8 分别指定索引名称a b c d

更改指定索引的值:把索引d 对应的值重新赋值为9

索引也可以通过赋值的方式进行修改

series数组之间可以通过运算符进行运算,例如我们把demo 和 demo2进行相加,从显示的结果来看只要索引名称相同的值才进行了加的运算,索引不匹配的都是显示NaN

那么如何把demo3里面是NaN的无效数据行删除呢?这也是数据分析里面的数据清洗的一个小点点

这里用到dropna函数,如下图,清理是空的数据行。dropna()默认是清理空的数据行,原始数据不变化,

如下删除后的数据赋予demo4了  demo3的数据是不变化的

dropna 有两个参数:axis=0,inplace=False 是默认的,axis=0 代表删除行,inplace=False代表不修改原始数据。如果在原数据上修改 inplace=True , 删除整列时axis=1 需要配合列名使用 指定具体的列。

series 的增、删、改、查:

增: 是用append()函数进行两个series进行链接,add()函数是加法运算不是增加元素。

例如把 exp 追加到 demo 的后面:

删:用drop()函数

例如把demo的元素f删除,还记得inplace=True是什么作用了吗?在原始数据基础上修改

改:前面好像讲过了,就是通过索引直接赋值

例如把demo的索引g对应的值有11改成15

查:前面说过可以通过索引查单独的值

也可以通过索引切片和位置切片查询一部分值

例如:demo['a':'c'] 是索引a---c之间的值

demo[:3] 是前3个值

也可以利用函数head()显示前多少行,默认是前5行,也可以指定数字

同理还有个函数显示后面多少行 tail() 默认是后5行,也可以在指定数字

以上就是整理的series的简单用法,也是数据分析中用到的常用点。像学习其他语言一样,学习一个结构的时候,要弄清楚这个数据结构的:增、删、改、查 ,也是学习的逻辑思路。

上一篇 下一篇

猜你喜欢

热点阅读