常用代码记录--遍历文件操作/文件读取和保存(csv格式)

2021-01-06  本文已影响0人  LiBiscuit

最近忙着跑实验 没什么更新
今天把常用的一些代码操作记录一下 以便有需要的时候直接CV

1.遍历文件并执行相同操作
举个例子比如你需要对一个文件夹下面的每张图片完成相同的操作
可用到以下操作

def read_directory(directory_name):
    for filename in os.listdir(directory_name):
        print(filename)  # 仅仅是为了测试
        img = cv2.imread(directory_name + "/" + filename,cv2.IMREAD_GRAYSCALE)
      #填入相同操作代码,举个例子比如删除黑色图片
        if cv2.countNonZero(img) == 0:
            print("Image is black")
            os.remove(directory_name + "/" + filename)
# main
if __name__ == '__main__':
   # read
read_directory("F:\BaiduNetdiskDownload\mini_Imagenet\dataset\\train\\n04296562")

2.读取文件夹下的文件名并保存为CSV

import os
import csv
import re
root_path = 'F:\\BaiduNetdiskDownload\\mini_Imagenet\\dataset\\train'
#
#
# # 将所有目录下的文件信息放到列表中
def get_Write_file_infos(path):
    # 文件信息列表
    file_infos_list = []
    # 遍历并写入文件信息
    for root, dirnames, filenames in os.walk(path):

        for filename in filenames:
            file_infos = {}
            dirname = root
            print(root)
            dirname = re.findall(r'[^\\ /:*?"<>|\r\n]+$',dirname)
            # 正则表达式来截取文件夹名称
            # 正则表达式还得学习
            filename1 = filename.split('.jpg')[0]
            file_infos["file"] = filename1
            file_infos["species"] = dirname
            
            # 将数据追加字典到列表中
            file_infos_list.append(file_infos)

   return file_infos_list

# 写入csv文件
def write_csv(file_infos_list):
    with open('1.csv', 'a+', newline='') as csv_file:
        csv_writer = csv.DictWriter(csv_file, fieldnames=['file', 'species'])
        csv_writer.writeheader()
        for each in file_infos_list:
            csv_writer.writerow(each)

# 主函数
def main():
    # 调用获取文件信息的函数
    file_infos_list = get_Write_file_infos(root_path)
    # 执行写入程序
    write_csv(file_infos_list)

# # 主程序入口
if __name__ == '__main__':

    main()

未完待续~

上一篇下一篇

猜你喜欢

热点阅读