《Python编程快速上手—让繁琐工作自动化》第9章实践项目答案

2017-10-30  本文已影响0人  Wuhouxxxx

9.4 项目:将带有美国风格日期的文件改名为欧洲风格日期

项目要求:上千个文本文件,文件名包含美国风格的日期( MM-DD-YYYY),需要将它们改名为欧洲风格的日期( DD-MM-YYYY)

#! python3
# change data format from A_style to E_style

import shutil, os, re

dateRegex = re.compile(r"""
    ((0|1)?\d)-         # month
    ((0|1|2|3)?\d)-     # day
    ((19|20)\d\d)       # year
    """, re.VERBOSE)

for amerfilename in os.listdir('.'):
    euroFilename = dateRegex.sub(r'\3-\1-\5', amerfilename)
    if euroFilename == amerfilename:
        continue
    abswd = os.path.abspath('.')
    amerfilename = os.path.join(abswd, amerfilename)
    euroFilename = os.path.join(abswd, euroFilename)

    print('rename "%s" to "%s"' % (amerfilename, euroFilename))
    shutil.move(amerfilename, euroFilename)

思路:

  1. 上面的解决方案和书中给的有些不同,代码更加精简
  2. euroFilename = dateRegex.sub(r'\3-\1-\5', amerfilename),亮点就是用“\数字”来进行位置对换;而书中给了大量中间变量,浪费了内存空间(个人意见)
  3. 这个好好琢磨,还是很有意思的,大家可以交流有无更优解

9.5 项目:将一个文件夹备份到一个 ZIP 文件

项目要求:假定你正在做一个项目,它的文件保存在 C:\AlsPythonBook 文件夹中。你担心工作会丢失, 所以希望为整个文件夹创建一个 ZIP 文件, 作为“快照” 。你希望保存不同的版本, 希望 ZIP 文件的文件名每次创建时都有所变化。

#! python3
# backup a folder to zip

import zipfile, os

def backuptozip(folder):
    folder = os.path.abspath(folder)
    os.chdir(folder)
    number = 1
    while True:
        zipFilename = os.path.basename(folder) + '_' + str(number) + '.zip'
        if not os.path.exists(zipFilename):
            break
        number += 1

    print('Creating %s...' % (zipFilename))
    backupZip = zipfile.ZipFile(zipFilename,'w')

    for root, dirs, files in os.walk(folder):
        print('Adding files in %s...' % root)
        backupZip.write(root.replace(folder,'.\\'))

        for file in files:
            newBase = os.path.basename(folder) + '_'
            if file.startswith(newBase) and file.endswith('.zip'):
                continue
            backupZip.write(os.path.join(root.replace(folder,'.\\'),file))

    backupZip.close()
    print('to_zip Done!')

backuptozip('old')

思路:

  1. 此项目书中已经给了详细的解答
  2. 主要是zipfile和os.walk的掌握

9.8.1 实践项目:选择性拷贝

项目要求:编写一个程序,遍历一个目录树,查找特定扩展名的文件(诸如.pdf 或.jpg),不论这些文件的位置在哪里, 将它们拷贝到一个新的文件夹中。

#! python3
# selective copy

import os, shutil
os.chdir('old')
# to generate a file, and make sure the file has not existed
try:
    os.makedirs('copy_to_this_dir')
except FileExistsError:
    pass
# walk throgh a dir and find particular file, like '.pdf','.txt', etc.
for root, dirs, files in os.walk('.'):
    for file in files:
# what kind of file that you want to copy
        if file.endswith('.bak') or file.endswith('.dat'):
# 这一步很重要,是为了排除自己复制成自己(因为os.walk的直线遍历性)
            if file not in os.listdir('copy_to_this_dir'):
# copy these files to a new folder
                shutil.copy(os.path.join(root,file),'copy_to_this_dir')

思路:

  1. 当时做这个作业居然几乎每步都写了注释,已经十分详尽
  2. 主要就是注意FileExistsError和“排除自己复制成自己”这两点

9.8.2 实践项目:删除不需要的文件

项目要求:编写一个程序,遍历一个目录树,查找特别大的文件或文件夹, 比方说, 超过100MB 的文件 (回忆一下,要获得文件的大小,可以使用 os 模块的 os.path.getsize())。将这些文件的绝对路径打印到屏幕上。

#! python3
# list oversized file in particular folder(and delete it)

import os

for root, dirs, files in os.walk('.'):
    for file in files:
        file_name = os.path.join(root, file)
        if os.path.getsize(file_name) > 1024*1024:
            print(file_name)

思路:

  1. 这个项目很简单,就是os.path.getsize的运用
  2. 1024*1024,这个很小,因为当时我练习时的文件中文件都是几k,按需放大即可
  3. 这个只是找出,并没有加入删除的代码

9.8.3 实践项目:消除缺失的编号

项目要求:编写一个程序, 在一个文件夹中, 找到所有带指定前缀的文件, 诸如 spam001.txt,spam002.txt 等,并定位缺失的编号(例如存在 spam001.txt 和 spam003.txt,但不存在spam002.txt)。让该程序对所有后面的文件改名,消除缺失的编号。

#! python3
# complete the filename that contain sequence like'spam001','spam003'

import os, re, shutil
os.chdir('spam')

# 找到指定文件夹中所有带指定前缀的文件
o_filenames = [x for x in os.listdir('.') if '.' in x and 
                x.startswith('abc')]
print(o_filenames)

# 定位缺失的编号
numRegex = re.compile(r'^abc(.*?).txt$')
o_num_list = []
for o_filename in o_filenames:
    t_name_re = numRegex.search(o_filename)
    o_num_list.append(t_name_re.group(1))
print(o_num_list)

n_num_list = []
for i in range(1,len(o_num_list)+1):
    t_i = '%03d' % i
    n_num_list.append(t_i)
print(n_num_list)

for i in n_num_list:
    if i not in o_num_list:
        print("abc%s.txt" % i)

# 对文件改名以消除缺失的编号
for i,v in zip(o_num_list, n_num_list):
    shutil.move('abc%s.txt'%i, 'abc%s.txt'%v)

print('Rename project is done!')

思路:

  1. 当初构思了这道题挺久,然后网上找了答案结果找不到理想的,有个同学的答案不够简洁优美。就自己认真专研了,结果写出来很有成就感
  2. 找到指定文件夹中所有带指定前缀的文件:用了列表生成器[x for x in os.listdir...]来简化代码
  3. 定位缺失的编号:用了两个列表来装origin和not-origin的编号;t_i = '%03d' % i 这个能用0来填充成三位数
  4. 对文件改名以消除缺失的编号:用了zip来并列修改文件名字,也是极大简化了代码

就是因为9.8.3这道题,我才决定发博客和更多人交流。相较于一位网上同学的答案,此代码亮点在’%03d’和zip()函数的使用,还有任务拆分清晰。 做了个把小时的,代码还算满意,激励下自己继续努力。 如有错误,请指出以相互学习,多谢!


环境:python3

想做这个系列文章,就是因为当时看这本书时,想看看网上有没更优美的解决,但是略难找到。所以就把自己的项目练习放在了一个txt文件中,现在把练习代码放到这里,有不足之处希望大家能给出指导意见及相互交流、提升。

上一篇下一篇

猜你喜欢

热点阅读