数据清洗函数

2022-10-25  本文已影响0人  漫长的白日梦技术大佬

数据清洗函数

duplicated()

判断序列元素是否重复,

drop_ duplicates() #删除重复值
hasnans()

判断序列是否存在缺失(返回TRUE或FALSE)

isnull()

判断序列元素是否为缺失(返回与序列长度一样的bool值)

notnul()

判断序列元素是否不为缺失(返回与序列长度一样的bool值)

dropna()#删除缺失值
fillna()#缺失值填充
fill()#前向后填充缺失值(使用缺失值的前一个元素填充)
bfil()#后向填充缺失值(使用缺失值的后一个元素填充)
dtypes() .#检查数据类型
astype()#类型强制转换
pd.to_ datetime# 转日期时间型
factorize()#因子化转换
sample()#抽样
where()#基于条件判断的值替换
replace()#按值替换(不可使用正则)
str.replace()#按值替换(可使用正则)
str.split.str()#字符分隔

上一篇 下一篇

猜你喜欢

热点阅读