python之重复值(duplicated)

2020-11-30  本文已影响0人  默直

检查重复值duplicated()

Duplicated函数功能:查找并显示数据表中的重复值
这里需要注意的是:

1.查询重复值的位置
data.duplicated()   #返回布尔型数据,告诉重复值的位置
image.png
2.检查有多少重复值
data.duplicated().sum() #说明有4个重复值
image.png
3.打印重复值
data[data.duplicated()]#打印重复值
或者
data[data.duplicated()==True]#打印重复值
image.png
4.打印非重复值
data[data.duplicated()==False]#打印重复值
5.删除重复记录(drop_duplicates())

drop_duplicates函数功能是:删除数据表中的重复值,判断标准和逻辑与duplicated函数一样

#inplace=True表示直接在源数据上进行操作
data.drop_duplicates(inplace=True) 
6.重置索引reset_index
data.reset_index()
上一篇 下一篇

猜你喜欢

热点阅读