人工智能通识

用Python将一个文件夹中的文件分别拷贝到不同文件中

2019-08-24  本文已影响6人  郑志凯

最近华为云发布了垃圾分类识别的比赛,就注册账号,想看看。从官网上下载了数据,发现图片和txt文档是放在一个文件夹里的。其中命名对应的txt中是标明了该图片的垃圾分类ID


华为垃圾分类文件夹.png 垃圾分类ID.png

但其实在分析数据的过程中,我希望查看一下每个分类下面的图片的情况,所以希望按照将同一个分类的图片能放在同一个文件夹中,以方便查看。 这时候,就用了到了shutil库

同时,因为类目ID和垃圾分类类目的关系存储在了另外的一个JSON文件中,也需要将其读取进来,然后根据映射情况来命名文件夹

具体的代码和详细备注如下:

#coding:utf-8
import os
import json
import shutil
import re

#读取下载的文件
f_list = os.listdir('下载的文件地址路径')

#将类目ID同分类映射的JSON文件读进来
with open('JSON文件地址路径', encoding='utf-8') as f:
    rules = json.loads(f.read())
    f.close()

#开始来拷贝文件了
for file in f_list:
    #由于文件夹中有txt文件和jpeg两种格式,需要进行处理,读取txt格式文件
    if os.path.splitext(file)[1]  == '.txt':
        imgID =file.replace('.txt','')
        f=open('下载的文件地址路径'+'/'+file,'r+').readlines()
        file_name,cateID=f[0].split(',')
        #小细节处理,因为上一步对文件处理提取cateID是,得到的格式是‘  1’而不是‘1’,故需要处理一下用re库的replace删除
        fold_name=rules[cateID.replace(' ','')]
        #另一处小细节处理,看上图可以看到数据中的命名为'可回收垃圾/旧衣服',这样在Python路径中作为文件名会导致多一层文件,故改成了’可回收垃圾_旧衣服‘
        fold_name=fold_name.replace('/','_')
        #设置最后要拷贝的文件名称
        determination = '文件夹路径名'+fold_name+'/'
        #判断文件夹是否存在
        if not os.path.exists(determination):
            os.makedirs(determination)
        #从一个文件中往另外一个文件夹移动文件
        shutil.copyfile('下载的文件地址路'+file_name, determination+file_name)
        
print('Done')

最后可以看到拷贝移动完后的结果如下图:


拷贝完后端结果.png
上一篇下一篇

猜你喜欢

热点阅读