Python Pandas 基于两个字段/主键进行连接

2024-01-03  本文已影响0人  王叽叽的小心情

需求:有两个CSV文件,需要依据两个字段(如地区和年份)进行匹配,只有两个字段同时匹配的时候才进行空间连接

Python代码如下:

import pandas as pd

def main():
    df1 = pd.read_csv(r"E:\data1.CSV", header=0, encoding='gbk')
    df2 = pd.read_csv(r"E:\data2.CSV", header=0, encoding='gbk')
    df_merge = pd.merge(df1, df2, how='left', left_on=['区划代码', '年份'], right_on=['区域代码', '年'])
    df_merge.to_csv(r"E:\合并对比.csv", header=True, encoding='gbk')

if __name__ == '__main__':
    main()

关键点:基于on的字段可以采用列表形式添加多个进行匹配,注意字段前后顺序需要一致。

如果两个文本的字段一致,可以直接采用on = ['id', 'year]进行匹配

果然是好久没干过活了呀,老早之前用过的东西都忘记了,要继续努力干活呀

上一篇下一篇

猜你喜欢

热点阅读