zipfile模块
2017-02-27 本文已影响115人
longwz
实现解压缩,压缩文件的模块。
简单使用:
import zipfile
f = zipfile.ZipFile('filename.zip', 'w' ,zipfile.ZIP_DEFLATED)
f.write('file1.txt')
f.write('file2.doc')
f.write('file3.rar')
f.close()
f.zipfile.ZipFile('filename')
f.extractall()
f.close()
其他的一些方法:
zipfile.is_zipfile(filename) #判断一个文件是不是压缩文件
ZipFile.namelist() #返回文件列表
ZipFile.open(name[, mode[, password]]) #打开压缩文档中的某个文件
ZipFile.infolist() #返回ZipInfo对象列表
ZipFile.getinfo(name) #返回ZipInfo对象
ZipInfo.filename
ZipInfo.date_time #返回值的格式为(year,month,date,hour,minute,second)
ZipInfo.compress_type
ZipInfo.comment
ZipInfo.extra
ZipInfo.create_system
ZipInfo.extract_version
ZipInfo.reserved
ZipInfo.flag_bits
ZipInfo.volume
ZipInfo.internal_attr
ZipInfo.external_attr
ZipInfo.header_offset
ZipInfo.CRC
ZipInfo.file_size
ZipInfo.compress_size
ZipFile.testzip() #检查每个文件和它对应的CRC,如果有错误返回对应的文件列表
ZipFile.setpassword(password)
ZipFile.read(name[,password])
ZipFile.printdir()
ZipFile.writestr(zipinfo_or_arcname, bytes)
其中有一个坑,ZipFile对象中的filename编码方式为cp437,Python2与分别按照各自方式解决。
如不清楚编码问题的,可以参照我的另一个blog:编码问题以及其在Python2与3的差异
这个分享一个Python2的解决方式。着急解决问题的看下面的。
import zipfile
import os
import shutil
def extract_all(zip_filename, extract_dir, filename_encoding='GBK'):
zf = zipfile.ZipFile(zip_filename, 'r')
for file_info in zf.infolist():
filename = unicode(file_info.filename, filename_encoding).encode("utf8")
print 'filename is ', filename
output_filename = os.path.join(extract_dir, filename)
output_file_dir = os.path.dirname(output_filename)
if not os.path.exists(output_file_dir):
os.makedirs(output_file_dir)
with open(output_filename, 'wb') as output_file:
shutil.copyfileobj(zf.open(file_info.filename), output_file)
zf.close()
if __name__ == '__main__':
zip_filename = '/export/test/abc.zip'
extract_dir = '/export/test'
extract_all(zip_filename, extract_dir)