drop_duplicates 去重失败
2018-12-28 本文已影响36人
你说我对钱一往情深
drop_duplicates用法:
#去除data中a,b两列均重复的行,并保留最后一个
data.drop_duplicates(['a','b'],keep='last')
#去除所有列都一样的行
data.drop_duplicates()
关于失败:
data.drop_duplicates(['a','b'],keep='last')
print(data)
这个时候我发现原本的data里还是有重复的数据,,好气
解决方案:
data.drop_duplicates(['a','b'],inplace=True)
print(data)
原因:drop_duplicates(inplace=True)是直接对原dataFrame进行操作。
drop_duplicates(inplace=False)是重新创建一个新的DataFrame并进行删除,对原DataFrame不进行改变。