爬虫

Python图片批量处理二三事(一)

2017-02-19  本文已影响462人  mugichya

爬图片是另一篇文章,以后更新。先说说如果当初爬的时候没有对格式进行输出的整理,那么拿到的将会是一堆杂乱无章的图片,当然,这事儿不是我干的。大量的图片手动改名?——No, No, No, 那怎么还会在这里废话!?

os和shutil

先导入这两个模块,处理文件目录少不了os模块,包含了通用的操作系统功能,与具体的平台无关。shutil模块也是Python自带,用于文件的复制,移动等。

更多操作可以参考友情链接:http://www.jb51.net/article/50070.htm

文件重命名示例

好了,现在我们有这么一个文件夹:

原始文件夹,包含了原始图片素材和子文件夹。

想要整理之后得到这样的效果:

整理后的效果

如图展示的整理效果,最终就一个文件夹,里面是统一命名的图片,不过内容有差别,下载的时候将需要的Logo放在里一个文件夹里作为子目录,与其同级的是许多照片,并且任选其中一张作为首页图(首页.jpg),其他的是内容(内容1.jpg,内容2.jpg等等)。是的,图片的格式还有png,我们全部改成jpg。

base_path = 'E:/XX/XX/'  # 目标文件夹位置
in_path = 'E:/XX/XX/Download_Img_org/' # 目标文件夹的完整路径
out_path = in_path  

我们将文件夹里面的图片重命名以后还是放在原始文件夹里面,让输出路径与in_path一样的。

in_content_name = os.listdir(in_path)  # 回目录下的所有文件和目录名
for in_name in in_content_name:
    in_content_path = in_path + in_name
    in_path_list.append(in_content_path)
    # print(in_content_path) # 这里可以尝试打印确认看看
os.rename(in_path_list[0], out_path + '首页' + '.jpg')

然后其他的图片是内容+序号,从前面的in_path_list取出来使用就好。但此时的目录下既有文件还有子目录,需要先对文件进行处理,用到os.path.isdir(path)判断一个路径是文件还是目录,接着遍历文件更名。

n = 1
for path in in_path_list[1:]:
    if os.path.isdir(path) is True:
        out_folder_name = path.split('/')[-1]
        # print(out_folder_name)
    elif n <= len(in_path_list)-2:  # 去除子目录和改为首页.jpg的图片
        os.rename(path, out_path + '内容' + str(n) + '.jpg')
        n += 1

那么最后剩下的是对子目录中的文件更名并把子目录的文件名作为更新后的上级目录名称。操作也是类似的,这里就用到了shutil模块的一些操作。直接上代码+注释:

out_content_name = os.listdir(out_path)
for out_name in out_content_name:
    out_content_path = out_path + out_name
    out_path_list.append(out_content_path)

    if os.path.isdir(out_content_path) is True:
        # print(os.listdir(out_content_path)) 打印的结果是列表,下面添加srcdir的时候不能直接转换为字符串,需用for循环取出
        for logo_name in os.listdir(out_content_path):
            if logo_name != 'Logo.jpg':
                os.rename(out_content_path + '/' + logo_name, out_path + 'Logo.jpg')  # 重命名另存到外部路径下
                os.rmdir(out_content_path)
            else:
                shutil.copy(out_content_path + '/' + logo_name, out_path)  # 将文件直接copy,不改名
                os.remove(out_content_path + '/' + logo_name)
                os.rmdir(out_content_path)

os.rename(base_path + out_path.split('/')[-2], base_path + str(out_folder_name))
print('Folder ' + str(out_folder_name) + ' is done.') # 更改文件操作已经完成!

--------------------------------------------最后?----------------------------------------
之前想要解决文件批处理问题,临时去查了一些方法并应用起来,抛开算法和效率不说,也太low(=。=)这里展示的文件处理是在一个文件夹的文件,那么还有这样许许多多的文件夹怎么办?下一篇讲图片像素处理,很多文件夹里的图片批处理。。。

学无止境!

上一篇 下一篇

猜你喜欢

热点阅读