pandas自学笔记
2021-12-21 本文已影响0人
第六九书
0 导入pandas库
import pandas as pd
1 加载excel文件
# 加载文件可以是绝对路径,也可以是相对路径。我这里的文件是和程序文件在同一个文件夹中的文件,所以只写文件名即可。
df = pd.read_excel('FB261426.xlsx')
# 输出df
print(df)
![](https://img.haomeiwen.com/i14272177/f3238f51f11fb052.jpg)
2 获取df文件的行数和列数
df.shape
输出的是一个无组数据,(a,b)形式,a是df数据的总行数,b是总列数。
df.shape[0]
——获取总行数
df.shape[1]
——获取总列数
3 删除行
3.1 drop
方法删除
drop
方法删除有两种:
- 一是临时删除,原来数据保留,若要删除后的新数据,可用赋值新变量来获得
- 二是就地删除,在原数据上面删除,此时原数据变为删除新数据。
3.1.1 删除一行
删除某一指定索引号的行
临时删除:
df_new = df.drop(df.index[5]) # 注意,索引是从“0”开始的。
print(df)
print(df_new)
此时会发现,df_new比df少第5行。
就地删除
print(df)
# 注意,索引是从“0”开始的。
# inplace=True表示就地删除的意思
df.drop(df.index[5],inplace=True)
print(df)
此时会发现,新df比旧df少第5行。
3.1.2 指定索引删除多行
df.drop(df.index[[0,1,2,3,4,5,6]])
其中 特别要index后面的方括号。是两个方括号嵌套。所有要删除的行索引以列表形式,放在一个列表里面才可以。
若要就地删除,再加上inplace=True
,改成以下语句即可:
df.drop(df.index[[0,1,2,3,4,5,6]],inplace=True)
4 写入excel
以下语句配合,完成写入操作。
writer = pd.ExcelWriter('result.xlsx')
df.to_excel(writer,sheet_name='result')
writer.save()