生信

python数据科学03-pandas对象初识

2021-10-12  本文已影响0人  小贝学生信

Pandas是在NumPy基础上建立的新程序库,提供了一种高效的DataFrame数据结构


1、Pandas对象类型

import numpy as np
import pandas as pd

1.1 Series对象

关于显式索引与隐式索引
(1) 隐式索引:对于一个列表/数组而言,隐式索引就是表征顺序位置的信息。第一个元素的隐式索引永远是0、第二个元素的隐式索引永远是1......
(2) 显式索引:对于Pandas里的Series对象的每个元素,除了自然就有的隐式索引信息,还有自己的名字id充当显示索引,可供方便调用对象子集。
(3)不要将Series对象想的太复杂,对应R语言,就是一个有名字的字符串~~

(1)创建series对象

pd.Series(data, index = index),其中data与index可以是list/array,本身可以是多种数据类型,但各自内部要保持一致,且二者长度相同。

如果不设置index参数,则默认与隐式索引的值相同。此外还可以设置name=""的参数,增加Series对象的name属性。

(2)series对象取子集

1.2 DataFrame对象

(1)创建DataFrame对象
(2)DataFrame对象取子集

2、 Series与DataFrame的简单运算

2.1 Series运算

2.2 Series间的运算

DataFrame对象的简单运算以及DataFrame对象之间的运算与上面类似就不展开了

2.2 DataFrame与Series的运算

3、 关于NaN值,以及相关函数

上一篇 下一篇

猜你喜欢

热点阅读