五、pandas对缺失值进行填充
2022-08-25 本文已影响0人
minningl
一、读取excel数据
数据内容如下:
image.png
二、读取excel数据
df = pd.read_excel(data_path,skiprows=2)
ps:使用skiprows过滤掉头2行
image.png三、isnull 判断是否为空
df.isnull()
image.png
四、notnull 判断是否非空
df.notnull()
image.png
df['name'].notnull()
image.png
五、notnull 判断指定列是否非空
df.loc[df['score'].notnull(), :]
image.png
六、dropna 删除全为空的列
# 删除全是空的列
df.dropna(axis='columns', how='all', inplace=True)
image.png
七、dropna 删除全为空的行
# 删除全是空的行
df.dropna(axis='index',how='all',inplace=True)
image.png
八、fillna 缺失值填充
df.fillna({'score':0})
image.png
df.loc[:,'score'] = df['score'].fillna(0)
image.png
九、fillna按照前后的元素进行填充
df.loc[:,'name'] = df['name'].fillna(method='ffill')
# ffill forward fill,按照前一个填充
# bfill back fill,按照后一个填充
image.png
十、保存结果到excel
df.to_excel('datas/student_excel/student_excel_clean.xlsx', index=False)