pandas常用函数总结

2020-12-16  本文已影响0人  000ling

pandas常用函数

import pandas as pd
pd.__version__

导入并读取数据

path = ".//exercise_data/chipotle.tsv"
chipo = pd.read_csv(path,sep = '\t')

常用的pandas数据读取函数

pd.read_excel()  # 读取excel格式文件
pd.read_csv()  # 读取csv格式文件

注意:csv与tsv格式文件都是使用pd.read_csv()读取,但tsv文件的分隔符是制表符'\t',而csv文件的分隔符为逗号',',函数默认的分隔符为逗号,注意修改分隔符(参数sep)

查看数据前几行内容

chipo.head()  # 默认5行
chipo.head(10)  # 查看数据前10行

查看数据最后几行

chipo.tail()  #默认5行
chipo.tail(10)  # 查看数据后10行

查看数据统计情况

chipo.describe()  # 返回数据的count、mean、std、min、max、3个四分位数

查看数据的大小

chipo.size  # 返回数据的大小:行数*列数,注意没有括号

查看数据的形状

chipo.shape  # 返回二维数组:(行数,列数)

查看数据列名称

chipo.columns

查看数据索引

chipo.index  # 返回的是行索引信息

不同值计数

chipo.nunique()  # 返回的是不同值的个数

区分:

chipo.unique()  # 返回的是不同值

查看某个字段中有哪些不同的值,并计算每个值有多少个重复值

chipo['choice_description'].value_counts()

重置索引

chipo.reset_index(drop=True)

字段求和

chipo['quantity'].sum()
上一篇下一篇

猜你喜欢

热点阅读