呆鸟的Python数据分析

利用Python实现数据匹配(vlookup)

2019-12-05  本文已影响0人  小T数据站

平时我们经常会制作周报、月报这种Excel操作相同的报表,我们可以使用python的pandas库对其进行自动化。这篇文章就演示了利用python实现使用Excel中的vlookup函数,并将其脚本封装成exe可执行程序。
写这段脚本的原因是因为我们部门的一个做渠道的同事不太会用vlookup函数,所以我琢磨着将他要用到vlookup的工作需求写成脚本供他使用。
需求:要将B表中的“收入”字段的数据匹配到A表中去:
表A:


表A

表B


表B
结果:
结果

脚本内容如下:

import pandas as pd

table_a_name = input("请输入A表文件名:")
table_a_path = table_a_name + '.xlsx'
sheet_a_name = input("请输入A表中的sheet名称:")
table_a = pd.read_excel(table_a_path,sheet_name = sheet_a_name,converters={'订单号':str}).dropna(axis=1,how='all')
table_b_name = input("请输入B表文件名:")
table_b_path = table_b_name + ".xlsx"
sheet_b_name = input("请输入B表中的sheet名称:")
table_b = pd.read_excel(table_b_path,sheet_name=sheet_b_name,converters={'交易ID':str})
table_b_2 = table_b.groupby("交易ID").收入.sum().reset_index()
table_c = table_a.merge(right=table_b_2,how='left',left_on='订单号',right_on='交易ID')
table_c.to_excel('c.xlsx',index=False)

考虑到同事不会使用python,故将这段脚本封装成可执行exe文件,关于怎样将Python代码封装打包成可执行的exe文件以及可能碰见的报错解决详见我之前的文章:将python脚本打包封装成exe程序

过程演示.gif
但是上面的exe使用起来并不够直观、方便,故又利用tkinter制作了一个GUI界面:
GUI界面.gif
制作GUI界面的脚本如下:
#!/usr/bin/python
# -*- coding:utf-8 -*-

from tkinter import *
import pandas as pd
import os
import re
window = Tk()
window.title('数据匹配')
window.geometry('300x400')
var1 = StringVar()
var2 = StringVar()
var3 = StringVar()
var4 = StringVar()
var5 = StringVar()
var6 = StringVar()
var7 = StringVar()
L1 = Label( text="请输入表A的名称:")
L1.pack()
e1 = Entry(window,show=None,textvariable=var1)
e1.pack()
L2 = Label( text="请输入表A中sheet名称:")
L2.pack()
e2 = Entry(window,show=None,textvariable=var2)
e2.pack()
L3 = Label( text="请输入表A中的ID列:")
L3.pack()
e3 = Entry(window,show=None,textvariable=var3)
e3.pack()
L4 = Label( text="请输入表B的名称:")
L4.pack()
e4 = Entry(window,show=None,textvariable=var4)
e4.pack()
L5 = Label( text="请输入表B中sheet名称:")
L5.pack()
e5 = Entry(window,show=None,textvariable=var5)
e5.pack()
L6 = Label( text="请输入表B中的ID列:")
L6.pack()
e6 = Entry(window,show=None,textvariable=var6)
e6.pack()
L7 = Label( text="请输入要匹配的表B中的列名:")
L7.pack()
e7 = Entry(window,show=None,textvariable=var7)
e7.pack()


def data_match():
    path = 'C:\\Users\\PS20190225\\Desktop'
    os.chdir(path)

    table_a_path = e1.get()
    a_type = re.search(r'([a-z]*).([a-z]*)',table_a_path).group(2)
    sheet_a_name = e2.get()
    A_id = e3.get()
    if a_type == 'xlsx':
        table_a = pd.read_excel(table_a_path,sheet_name = sheet_a_name,converters={A_id:str}).dropna(axis=1,how='all')
    else:
        table_a = pd.read_csv(table_a_path, sheet_name=sheet_a_name, converters={A_id: str}).dropna(axis=1, how='all')

    table_b_path = e4.get()
    b_type = re.search(r'([a-z]*).([a-z]*)',table_b_path).group(2)
    sheet_b_name = e5.get()
    B_id = e6.get()
    target_col = e7.get()
    if b_type == 'xlsx':
        table_b = pd.read_excel(table_b_path, sheet_name=sheet_b_name, converters={B_id: str}).dropna(axis=1, how='all')
    else:
        table_b = pd.read_csv(table_b_path, sheet_name=sheet_b_name, converters={B_id: str}).dropna(axis=1, how='all')
    table_b_2 = table_b.groupby(B_id)[target_col].sum().reset_index()

    table_c = table_a.merge(right=table_b_2,how='left',left_on=A_id,right_on=B_id)
    table_c.to_excel('c.xlsx',index=False)

b = Button(window,text='进行匹配',width=15,height=2,command=data_match)
b.pack()
window.mainloop()

学习tkinter可观看莫凡大佬的视频:做简单窗口视窗

上一篇 下一篇

猜你喜欢

热点阅读