我爱编程

Pandas

2018-05-17  本文已影响50人  闫_锋

提供高性能易用数据类型和分析工具

1)便于操作数据的数据类型
Series, DataFrame

2)分析函数和分析工具
基本操作,运算操作,特征类操作,关联类操作

数据分析容易

import pandas as pd
3.png

Series类型由一组数据及与之相关的数据索引组成。

列表

import pandas as pd
a = pd.Series([9, 8, 7, 6])
b = pd.Series([9, 8, 7, 6], index=['a', 'b', 'c', 'd'])

Series类型可以由如下类型创建
Python列表
标量值
Python字典
ndarray
其他函数

标量

s = pd.Series(25, index=['a', 'b', 'c'])

字典

d = pd.Series({'a':9, 'b':8, 'c':7})
e = pd.Series({'a':9, 'b':8, 'c': 7}, index = ['c', 'a', 'b', 'd'])

ndarray

import pandas as pd
import numpy as np

n = pd.Series(np.arange(5))
n = pd.Series(np.arange(5), index = np.arange(9, 4, -1))

Series类型包括index和values两部分
Series类型的操作类似ndarray类型
Series类型的操作类似Python字典类型

b = pd.Series([9, 8, 7, 6], ['a', 'b', 'c', 'd'])
b.index
b.values

Series是一维带'标签‘数组
Series基本操作类似ndarray和字典,根据索引对齐

DataFrame类型
二维数据类型,表格类型,每列值类型可以不同。
DataFrame类型由共用相同索引的一组列组成
DataFrame既有行索引,也有列索引。
DataFrame常用于表达二维数据,但可以表达多维数据。

创建:

二维ndarray对象

d = pd.DataFrame(np.arange(10).reshape(2,5))

从一维ndarray对象字典创建

dt = {'one': pd.Series([1,2,3], index=['a','b','c']),
      'two': pd.Series([9, 8, 7, 6], index = ['a','b','c','d'])}

DataFrame类型
DataFrame是二维带'标签'数组。
横向index
纵向column
DataFrame基本操作类似Series,依据行列索引。

上一篇 下一篇

猜你喜欢

热点阅读