Anacanda计算机编程Python 专题

Python——Pandas数据结构介绍

2020-01-04  本文已影响0人  进击的码农设计师

1.Pandas库介绍:

Pandas是Python第三方库,提供高性能易用数据类型和分析工具,其所包含的数据 结构和数据处理工具的设计使得在Python中进行数据清洗和分析非常方便。
Pandas是基于Numpy实现,常与Numpy、Scipy和Matplotlib一同使用。
Pandas的引用直接使用以下语句即可:

import pandas as pd # 尽管别名可以省略或者修改,建议使用上述约定的别名

2.Pandas库的理解:

Pandas库主要有两种数据类型:Series(相当于一个一维数据类型)、DataFrame(相当于一个二维到多维数据类型) ,并基于上述两个数据类型提供了各类操作: 基本操作、运算操作、特征类操作、关联类操作。

Numpy Pandas
基础数据类型 扩展数据类型
关注数据的结构表达 关注数据的应用表达
维度:数据间关系 数据与索引间关系

3.Pandas库的Series类型:

3.1 Series类型介绍:

Series类型是由一组数据及与之相关的数据索引组成,即一维的带“标签”的数组。Series类型包括index和value两部分。

image image
3.2 Series类型的创建:
image image

如要构造与字典不同的数据类型时刻采用index参数:


image image

4.Pandas库的DataFrame类型:

4.1 DataFrame类型介绍:

DataFrame类型由共用相同索引的一组列组成。
DataFrame是一个表格型的数据类型,每列值类型可以不同;
DataFrame既有行索引(index),也有列索引(column);
DataFrame常用于表达二维数据,但可以表达多维数据。

image
4.2 DataFrame类型的创建:
image image image
上一篇下一篇

猜你喜欢

热点阅读