python小白联盟numpy&pandas&matlaplibPandas

尝尝pandas(1)

2018-08-23  本文已影响3人  雨路浅歌

​      好久不见,今天给大家带来新的内容——pandas,这个库有多出名就不用我说了吧,下面正式今天的学习。

创建Series

很容易看出,行索引(我喜欢这么叫)的数值默认是从0开始的数字,如果想要改变行索引,可以设置index的值,注意index是一个列表。

如果含有一个float类型的数字或一个无效值(np.nan),那么即使其它都是整型,其类型也是浮点型。

如果内容只有一个,其会随着索引而重复出现。

字典创建Series的方式

创建DataFrame

什么是DataFrame?可以简单地认为DataFrame就是一个表格。

和Series一样,DataFrame的行索引也是默认为从0开始的数字,如果想要改变,也可以通过设置index来改变。

但是由于Series的行索引的默认值是从0开始的,所以'C'列无法显示,故而需要给'C'列添加同样的行索引。

另一种创建DataFrame的方法是分别使用列表的形式创建行索引和列索引。

查看DataFrame的数据

查看前五行。

当然,查看前五行只是默认值,我们还可以查看前三行等等。

查看后五行。

查看行索引和列索引。

查看内容

查看每一列对应的数据类型

对每一列的数据进行总结描述

分别是元素的个数、平均值、标准差、最小值、前25%大、……、最大值

当然,如果数据类型是字符,就没有所谓的最大值最小值之类的了,取而代之的是count(字符个数)、unique(不同字符的个数)、top(最多的字符)、freq(最多字符的个数)

DataFrame的变化

为了演示方便,我先创建一个乱序的DataFrame

转置

行索引排序(默认)

列索引排序

列索引排序,并把升序改为降序

把列索引为2的内容进行排序

把行索引为2的内容进行排序

把行索引为2的内容进行降序排序

今天的内容就是这些了,谢谢捧场!!!

python小白联盟
上一篇 下一篇

猜你喜欢

热点阅读