五、pandas对缺失值进行填充

2022-08-25  本文已影响0人  minningl

一、读取excel数据

数据内容如下:


image.png

二、读取excel数据

df = pd.read_excel(data_path,skiprows=2)

ps:使用skiprows过滤掉头2行

image.png

三、isnull 判断是否为空

df.isnull()
image.png

四、notnull 判断是否非空

df.notnull()
image.png
df['name'].notnull()
image.png

五、notnull 判断指定列是否非空

df.loc[df['score'].notnull(), :]
image.png

六、dropna 删除全为空的列

# 删除全是空的列
df.dropna(axis='columns', how='all', inplace=True)
image.png

七、dropna 删除全为空的行

# 删除全是空的行
df.dropna(axis='index',how='all',inplace=True)
image.png

八、fillna 缺失值填充

df.fillna({'score':0})
image.png
df.loc[:,'score'] = df['score'].fillna(0)
image.png

九、fillna按照前后的元素进行填充

df.loc[:,'name'] = df['name'].fillna(method='ffill')
# ffill forward fill,按照前一个填充
# bfill back fill,按照后一个填充
image.png

十、保存结果到excel

df.to_excel('datas/student_excel/student_excel_clean.xlsx', index=False)
上一篇下一篇

猜你喜欢

热点阅读