Python Pandas 基于两个字段/主键进行连接
2024-01-03 本文已影响0人
王叽叽的小心情
需求:有两个CSV文件,需要依据两个字段(如地区和年份)进行匹配,只有两个字段同时匹配的时候才进行空间连接
Python代码如下:
import pandas as pd
def main():
df1 = pd.read_csv(r"E:\data1.CSV", header=0, encoding='gbk')
df2 = pd.read_csv(r"E:\data2.CSV", header=0, encoding='gbk')
df_merge = pd.merge(df1, df2, how='left', left_on=['区划代码', '年份'], right_on=['区域代码', '年'])
df_merge.to_csv(r"E:\合并对比.csv", header=True, encoding='gbk')
if __name__ == '__main__':
main()
关键点:基于on的字段可以采用列表形式添加多个进行匹配,注意字段前后顺序需要一致。
如果两个文本的字段一致,可以直接采用on = ['id', 'year]
进行匹配
果然是好久没干过活了呀,老早之前用过的东西都忘记了,要继续努力干活呀