Python模块fileinput操作文件和目录操作总结
前言
之前介绍Python的 pathlib 模块可以有效的路径及文件查找等方便操作,本篇介绍一个相对 readlines() 获取文件内容更高效的用法
fileinput模块
对一个或者多个文件的内容迭代遍历(类似文件操作的readlines()),但是返回的是
迭代对象
,而不是一次性返回所有的文件内容行记录。
1、用法介绍
fileinput.input(files=None, inplace=False, backup='', *, mode='r', openhook=None, encoding=None, errors=None)
- • files 是要操作的文件列表,多文件格式为 ['f1.txt', 'f2.txt'],
默认是标准输入
- • inplace 是否将处理的结果
写回文件
,默认是不写回 - • backup 是否开启备份,开启的时候,只需要
指定备份的扩展名即可
,如果备份已经存在则会覆盖 - • mode 读写的模式,默认是只读
- • encoding 文件编码
2、常用到的函数
- • fileinput.input() 返回迭代对象,使用for循环读取。可以配合 with 使用
- • fileinput.filename() 返回当前文件名称
- • fileinput.lineno() 返回当前已经读取的
行的数量
注意和 filelineno的区别 - • fileinput.filelineno() 返回单签读取的行的行号
- • fileinput.isfirstline() 检查单签行是否是文件的第一行
- • fileinput.isstdin() 判断
最后一行
是否从标准stdin中读取 - • fileinput.close() 关闭文件,配置with使用的时候,不需要显著关闭
3、案例demo
3.1、 基于标准输入和命令行文件参数
#!/usr/bin/env python# encoding: utf-8#import fileinputdef demo1(): """演示基于标准输入""" print("文件名| 文件行号|文件行内容") for line in fileinput.input(): print(f"{fileinput.filename()}| {fileinput.filelineno()} | {line}") print(f"文件共有 {fileinput.lineno()} 行")if __name__ == '__main__': demo1()
命令行不加任何参数,表示从标准输入 stdin 获取信息
image-20221209170647696<figcaption style="text-align: center; line-height: 1.75; color: rgb(136, 136, 136); font-size: 0.8em;">image-20221209170647696</figcaption>
命令行有参数(文件)则读取文件内容
image-20221209170923786<figcaption style="text-align: center; line-height: 1.75; color: rgb(136, 136, 136); font-size: 0.8em;">image-20221209170923786</figcaption>
3.2、修改多个文件,并回写
到源文件
def demo2(): """ 演示多文件操作,并原地修改(写回当前文件) """ # 直接传参 # for line in fileinput.input(['fi_1.txt', 'fi_2.txt'], inplace=1): # 从命令行读取(标准输入) for line in fileinput.input(inplace=1): print(line.strip() + ' -> 我是回写')
image-20221209172108029
<figcaption style="text-align: center; line-height: 1.75; color: rgb(136, 136, 136); font-size: 0.8em;">image-20221209172108029</figcaption>
3.3、文件内容替换,并备份原文件
def demo3(): """实现源文件的内容替换,并实现备份""" for line in fileinput.input('1209_demo.txt', backup=".bak", inplace=1): print(line.rstrip().replace('Python', 'Django'))
执行脚本之后,发现 1209_demo.txt 文件中第一行的Python
变成了Django
# python demo_fileinput.py# cat 1209_demo.txthello Django in line one
3.4、利用``fileinput + re` 实现邮箱提取
def demo4(): pattern = "[a-zA-Z0-9]{3,9}@126.com" for line in fileinput.input("1209_demo.txt"): if re.search(pattern, line): print("Email: ", line)
执行脚本之后
# python demo_fileinput.pyEmail: lkjdlafje@126.comEmail: ouiolj303@126.com
Demo演示就到这里,通过案例学习它的方法怎么用,然后具体结合自己业务就好。
有问题,欢迎交流 ~