Pandas实现excel的vlookup并在指定列后输出

2021-09-06 本文已影响0人测试探索

背景：

有两个excel，他们有相同的一个列；
按照这个列合并成一个大的excel，即vlookup功能，要求：
- 只需要第二个excel的少量的列，比如从40个列中挑选2个列
- 新增的来自第二个excel的列需要放到第一个excel指定的列后面；
将结果输出到一个新的excel;

image.png

一、读取两个表的数据

#学生成绩表
df_grade = pd.read_excel(r"/Users/PycharmProjects/untitled/this/mz_test/学生成绩表.xlsx",engine="openpyxl")
print(df_grade.head())

#学生信息表
df_sinfo = pd.read_excel(r"/Users/PycharmProjects/untitled/this/mz_test/学生信息表.xlsx",engine="openpyxl")
print(df_sinfo.head())

目标：怎样将第二个“学生信息表”的姓名、性别两列，添加到第一个表“学生成绩表”，并且放在第一个表的“学号”列后面？

二、实现两个表的关联

筛选第二个表少量的列

df_sinfo = df_sinfo[["学号","姓名","性别"]]
print(df_sinfo.head())

image.png
两个表进行关联

df_merge = pd.merge(left = df_grade,right =df_sinfo,left_on = "学号",right_on= "学号")
print(df_merge)

image.png

三、调整列的顺序

1、查看列

a = df_merge.columns
print(a)

image.png

2、将columns变成python的列表形式

new_columns = df_merge.columns.to_list()
print(new_columns)

image.png

3、按逆序insert，会将"姓名"，"性别"放到"学号"的后面

for name in ["姓名","性别"][::-1]:
    new_columns.remove(name)
    new_columns.insert(new_columns.index("学号") + 1,name)
print(new_columns)

image.png

4、重置columns，并且输出到excel中

df_merge = df_merge.reindex(columns = new_columns)
df_merge.to_excel("/Users/PycharmProjects/untitled/this/mz_test/合并后学生成绩表.xlsx")

image.png

Pandas实现excel的vlookup并在指定列后输出

背景：

一、读取两个表的数据

二、实现两个表的关联

三、调整列的顺序

1、查看列

2、将columns变成python的列表形式

3、按逆序insert，会将"姓名"，"性别"放到"学号"的后面

4、重置columns，并且输出到excel中

猜你喜欢

热点阅读