R语言

drop_duplicates 去重失败

2018-12-28  本文已影响36人  你说我对钱一往情深

drop_duplicates用法:

#去除data中a,b两列均重复的行,并保留最后一个
data.drop_duplicates(['a','b'],keep='last')  
#去除所有列都一样的行
data.drop_duplicates() 

关于失败:

data.drop_duplicates(['a','b'],keep='last')  
print(data)

这个时候我发现原本的data里还是有重复的数据,,好气

解决方案:

data.drop_duplicates(['a','b'],inplace=True)  
print(data)

原因:drop_duplicates(inplace=True)是直接对原dataFrame进行操作。
drop_duplicates(inplace=False)是重新创建一个新的DataFrame并进行删除,对原DataFrame不进行改变。

上一篇下一篇

猜你喜欢

热点阅读