python对Excel表格进行去重

2023-12-27  本文已影响0人  ButICare_b72d

import pandas as pd

# 读取Excel文件 

df = pd.read_excel('your_file.xlsx') 

# 指定要检查重复值的列名 ,注意,这里的列名指的是首行值,不是A列,B列,去重数据不包含首行

columns_to_check = ['column1', 'column2']    

# 删除重复值 

df = df.drop_duplicates(subset=columns_to_check, keep='first') 

# 将结果写入新的Excel文件 

df.to_excel('output_file.xlsx', index=False)

上一篇 下一篇

猜你喜欢

热点阅读