python学习日志

pandas使用

2017-11-24  本文已影响13人  Master_K

DataFrame

删掉有缺失值的数据
我们可以删掉有缺失值的数据,你可以选择删除行或者删除列
用的都是DataFrame.dropna(),当然Series也有dropna方法

cframe = frame[frame.a.notnull()]
去掉frame中key = 'a'标签中value为空的数据

使用pandas.read_table将表读到一个pandas DataFrame对象中
pandas.read_table('文件地址',sep='::',header=None,names=[key值/列名])

使用pands.merge函数将dataframe进行合并,自动根据列名进行区分
pd.merge(表1,表2)

使用pivot_table进行聚合操作
data.pivot_table('列rating',rows='列title',cols='列gender',aggfunc='mean')

合并数组dataframe pd.concat([],ignore_index = Ture),ignore_index = Ture新编行号 不保留read_csv的原始行号,concat默认是按行将多个dataframe组合到一起的

DataFrame.tail(n=5)返回最后n行

DataFrame.groupby([列名]) 对该列名进行聚合 DataFrameGroupBy
groupby 具体先看文档吧😓还不怎么懂

DataFrame.apply(函数名) 调用函数传参为DataFrame

读取文件

读取Excel文件需要安装 xlrd工具
pip install xlrd
读取文件pandas.read_excel

上一篇下一篇

猜你喜欢

热点阅读