python 数据分析基础 day7-xlrd,xlwt读写多个
2018-03-20 本文已影响33人
billyang916
今天总结的内容为通过xlrd和xlwt模块将读取的多个excel文件中多个工作表输出至多个excel文件中。
通过xlrd和xlwt读多个excel文件并写入一个新excel文件
获取文件名可通过glob以及os模块进行,获取一个excel文件中的多个工作表则通过xlrd.open_workbook()函数所打开的excel文件对象的sheets()进行读取,以下实例为读取多个excel文件当中的多个工作表,并将每个excel文件的全部内容输出至一个excel文件的不同工作表中,代码如下:
import pandas as pd
import glob
import os
import xlrd
import xlwt
inputPath=r"读取excel文件的路径"
outputExcel=r"输出的excel文件的具体路径"
outputWorkbook=xlwt.Workbook()
#将读入数据写入变量中
for inputWorkbook in glob.glob(os.path.join(inputPath,"*.xlsx")):
with xlrd.open_workbook(inputWorkbook) as workbook:
workbookName=os.path.basename(inputWorkbook)
firstSheetFlag=1
setRow=0
for sheet in workbook.sheets():
#为输出工作表添加表头
if firstSheetFlag:
outputWorksheet=outputWorkbook.add_sheet(workbookName)
for cInd in range(sheet.ncols):
outputWorksheet.write(0,cInd,sheet.cell_value(0,cInd))
firstSheetFlag=0
for rInd in range(1,sheet.nrows):
for cInd in range(sheet.ncols):
outputWorksheet.write(rInd+setRow,cInd,sheet.cell_value(rInd,cInd))
setRow=setRow+sheet.nrows-1
outputWorkbook.save(outputExcel)
请注意,上述代码并未有对excel中的日期数据的格式进行处理,故输出至excel的日期字段的数据与实际看到的日期格式不同。