9.文件处理
一、实验目的
- 文件打开与关闭
- 文件读取与写入
二、知识要点
1.打印到屏幕
print("Python 是一个非常棒的语言,不是吗?")
输出为:Python 是一个非常棒的语言,不是吗?
2.读取键盘输入
-
raw_input
:raw_input([prompt]) 函数从标准输入读取一个行,并返回一个字符串(去掉结尾的换行符),例如:
str = raw_input("请输入:")
print("你输入的内容是: ", str)
输出为:
请输入:Hello Python!
你输入的内容是: Hello Python!
-
input()
:input([prompt]) 函数和 raw_input([prompt]) 函数基本类似,但是 input 可以接收一个Python表达式作为输入,并将运算结果返回。例如:
str = input("请输入:")
print("你输入的内容是: ", str)
这会产生如下的对应着输入的结果:
请输入:[x*5 for x in range(2,10,2)]
你输入的内容是: [10, 20, 30, 40]
3.文件操作
3.1 open()
打开文件
用Python内置的open()函数打开一个文件,创建一个file对象,相关的方法才可以调用它进行读写。语法如下:
file object = open(file_name [, access_mode][, buffering])
各个参数详解:
- file_name:file_name变量是一个包含了你要访问的文件名称的字符串值。
- access_mode:access_mode决定了打开文件的模式:只读,写入,追加等。所有可取值见如下的完全列表。这个参数是非强制的,默认文件访问模式为只读(r)。
- buffering:如果buffering的值被设为0,就不会有寄存。如果buffering的值取1,访问文件时会寄存行。如果将buffering的值设为大于1的整数,表明了这就是的寄存区的缓冲大小。如果取负值,寄存区的缓冲大小则为系统默认。
不同模式下打开文件的列表如下:
模式 | 描述 |
---|---|
t | 文本模式 (默认)。 |
x | 写模式,新建一个文件,如果该文件已存在则会报错。 |
b | 二进制模式。 |
+ | 打开一个文件进行更新(可读可写)。 |
U | 通用换行模式(不推荐)。 |
r | 以只读方式打开文件。文件的指针将会放在文件的开头。这是默认模式。 |
rb | 以二进制格式打开一个文件用于只读。文件指针将会放在文件的开头。这是默认模式。一般用于非文本文件如图片等。 |
r+ | 打开一个文件用于读写。文件指针将会放在文件的开头。 |
rb+ | 以二进制格式打开一个文件用于读写。文件指针将会放在文件的开头。一般用于非文本文件如图片等。 |
w | 打开一个文件只用于写入。如果该文件已存在则打开文件,并从开头开始编辑,即原有内容会被删除。如果该文件不存在,创建新文件。 |
wb | 以二进制格式打开一个文件只用于写入。如果该文件已存在则打开文件,并从开头开始编辑,即原有内容会被删除。如果该文件不存在,创建新文件。一般用于非文本文件如图片等。 |
w+ | 打开一个文件用于读写。如果该文件已存在则打开文件,并从开头开始编辑,即原有内容会被删除。如果该文件不存在,创建新文件。 |
wb+ | 以二进制格式打开一个文件用于读写。如果该文件已存在则打开文件,并从开头开始编辑,即原有内容会被删除。如果该文件不存在,创建新文件。一般用于非文本文件如图片等。 |
a | 打开一个文件用于追加。如果该文件已存在,文件指针将会放在文件的结尾。也就是说,新的内容将会被写入到已有内容之后。如果该文件不存在,创建新文件进行写入。 |
ab | 以二进制格式打开一个文件用于追加。如果该文件已存在,文件指针将会放在文件的结尾。也就是说,新的内容将会被写入到已有内容之后。如果该文件不存在,创建新文件进行写入。 |
a+ | 打开一个文件用于读写。如果该文件已存在,文件指针将会放在文件的结尾。文件打开时会是追加模式。如果该文件不存在,创建新文件用于读写。 |
ab+ | 以二进制格式打开一个文件用于追加。如果该文件已存在,文件指针将会放在文件的结尾。如果该文件不存在,创建新文件用于读写。 |
对于不同模式的可用操作如下表所示:
模式 | r | r+ | w | w+ | a | a+ |
---|---|---|---|---|---|---|
读 | + | + | + | + | ||
写 | + | + | + | + | + | |
创建 | + | + | + | + | ||
覆盖 | + | + | ||||
指针在开始 | + | + | + | + | ||
指针在结尾 | + | + |
3.2 close()
关闭文件
File
对象的 close()
方法刷新缓冲区里任何还没写入的信息,并关闭该文件,这之后便不能再进行写入。当一个文件对象的引用被重新指定给另一个文件时,Python 会关闭之前的文件。用 close()
方法关闭文件是一个很好的习惯。基本语法:
fileObject.close()
例如:
# 打开一个文件
fo = open("foo.txt", "w")
print("文件名: ", fo.name)
# 关闭打开的文件
fo.close()
输出:文件名: foo.txt
拓展:File对象的属性
一个文件被打开后,你有一个file对象,你可以得到有关该文件的各种信息。以下是和file对象相关的所有属性的列表:
属性 | 描述 |
---|---|
file.closed | 返回true如果文件已被关闭,否则返回false。 |
file.mode | 返回被打开文件的访问模式。 |
file.name | 返回文件的名称。 |
例如,首先在根目录下创建文件sample.txt
,然后执行程序:
fo = open("sample.txt", "w")
print("文件名: ", fo.name)
print("是否已关闭 : ", fo.closed)
print("访问模式 : ", fo.mode)
输出为:
文件名: sample.txt
是否已关闭 : False
访问模式 : w
3.3 write()
写入文件
write()
方法可将任何字符串写入一个打开的文件。需要重点注意的是,Python字符串可以是二进制数据,而不是仅仅是文字。write()
方法不会在字符串的结尾添加换行符('\n')
,基本语法为:
fileObject.write(string)
在这里,被传递的参数是要写入到已打开文件的内容。例如:
# 打开一个文件
# write
fo = open("sample.txt", "w")
fo.write("hello world!\nVery good!\n")
# 关闭打开的文件
fo.close()
上述方法会创建sample.txt文件,并将收到的内容写入该文件,并最终关闭文件。如果你打开这个文件,将看到以下内容:
hello world!
Very good!
3.4 read()
和readline()
读取文件
read()
方法从一个打开的文件中读取一个字符串。需要重点注意的是,Python字符串可以是二进制数据,而不是仅仅是文字。基础语法为:
fileObject.read([count])
在这里,被传递的参数是要从已打开文件中读取的字节计数。该方法从文件的开头开始读入,如果没有传入count,它会尝试尽可能多地读取更多的内容,很可能是直到文件的末尾。例如(我们继续使用上一条中创建的sample.txt
):
fo = open("sample.txt", "r+")
str = fo.read(10)
print("读取的字符串是 : ", str)
# 关闭打开的文件
fo.close()
输出为:读取的字符串是 : hello worl
而readline()
函数是读一行:
例如:
fo = open("sample.txt", "r+")
str_2 = fo.readline()
print(str_2)
输出为:hello world!
也可通过遍历:
fo = open("sample.txt", "r+")
for x in fo:
print(x)
来输出:
hello world!
Very good!
3.5 文件定位tell()
,位置改变seek()
tell()
方法告诉你文件内的当前位置, 换句话说,下一次的读写会发生在文件开头这么多字节之后。seek(offset [,from])
方法改变当前文件的位置。Offset变量表示要移动的字节数。From变量指定开始移动字节的参考位置。例如:
# tell()、seek()
fo = open("tell.txt", 'w') # 创建文件tell.txt
fo.write("vxiaozhe1998") # 在文件tell.txt中写入vxiaozhe1998
print("当前位置:",fo.tell()) # 输出当前位置
fo = open("tell.txt", "rb+")
# fo.tell() # 将指针移动至当前位置
fo.seek(5, 0) # 将指针以文件开头为参考位置向后移动5
str_1 = fo.read(3)
print("str_1=", str_1)
fo.seek(-2, 1) # 以当前位置为参考向前移动2
str_2 = fo.read(3)
print("str_2=", str_2)
fo.seek(-5, 2) # 以末尾为参考位置向前移动5
str_3 = fo.read(3)
print("str_3=", str_3)
输出为:
当前位置: 12
str_1= b'zhe'
str_2= b'he1'
str_3= b'e19'
具体指针操作流程如下:
seek
如果from被设为0,这意味着将文件的开头作为移动字节的参考位置。如果设为1,则使用当前的位置作为参考位置。如果它被设为2,那么该文件的末尾将作为参考位置。
3.6 重命名和删除文件
Python的os模块提供了帮你执行文件处理操作的方法,比如重命名和删除文件。要使用这个模块,你必须先导入它,然后才可以调用相关的各种功能。
-
rename()
方法:
语法:
os.rename(current_file_name, new_file_name)
os.rename(当前文件名,新文件名)
例如:
import os
# 创建文件first.txt
fo = open("first.txt", 'w')
# 在txt文件中添加内容first
fo.write("first")
# 关闭文件
fo.close()
# 更改文件名为second.txt
os.rename("first.txt", "second.txt")
此时在根目录中能够看到一个新文件second.txt
,文件中内容为first
-
remove()
方法
语法:
os.remove(file_name)
os.remove(文件名)
在rename()
代码的基础上我们运行:
import os
# 检测文件是否存在
try:
fo=open("second.txt")
print("文件已打开")
fo.close()
except Exception:
print("文件不存在")
# 移除文件second()
os.remove("second.txt")
# 检测文件是否还存在
try:
fo = open("second.txt")
print("文件已打开")
fo.close()
except Exception:
print("文件不存在")
输出为:
文件已打开
文件不存在
3.8 Python中的目录
mkdir()
可以使用os模块的mkdir()方法在当前目录下创建新的目录们。你需要提供一个包含了要创建的目录名称的参数。语法:
os.mkdir("newdir")
例如:
import os
os.mkdir("newdir") # 创建新目录
执行代码后将会在脚本位置处生成一个名称为newdir
的文件夹。
chdir()
可以用chdir()方法来改变当前的目录。chdir()方法需要的一个参数是你想设成当前目录的目录名称。语法:
os.chdir("newdir")
例如我们在上文中的newdir
文件夹中新建一个newdirs
目录,在newdirs
目录中新建文本文档index.txt
,执行下面代码:
import os
try:
fo =open("index.txt")
print(fo.read())
except Exception:
print("访问失败")
try:
os.chdir("newdir/newdirs")
fo = open("index.txt")
print(fo.read())
except Exception:
print("访问失败")
输出为:
访问失败
this is index.txt
getcwd()
getcwd()方法显示当前的工作目录。语法:
os.getcwd()
例如执行下述代码:
import os
print(os.getcwd())
我们会得到F:\Python\9
即为当前脚本所在路径
rmdir()
rmdir()方法删除目录,目录名称以参数传递。在删除这个目录之前,它的所有内容应该先被清除。语法:
os.rmdir('dirname')
例如:
import os
try:
os.mkdir("测试rmdir")
os.chdir("测试rmdir")
print("访问到rmdir目录")
except Exception:
print("rmdir目录不存在")
try:
os.rmdir("测试rmdir")
os.chdir("测试rmdir")
print("访问到rmdir目录")
except Exception:
print("rmdir目录不存在")
输出为:
访问到rmdir目录
rmdir目录不存在
更多资料
Python OS 文件/目录方法
Python File(文件) 方法
3.9 with()
语句
在实际情况中,我们应该尝试使用 with 语句处理文件对象,它会在文件用完后会自动关闭,就算发生异常也没关系。它是 try-finally 块的简写,例如:
with open("sample.txt") as fo:
for line in fo:
print(line, end="")
输出为:
hello world!
Very good!
das45 646
1
(sample.txt)中的内容
三、实验内容
1.拷贝文件
我们拷贝给定的文本文件到另一个给定的文本文件。
- 代码:
# import os
fo = open('a.txt', "w") # 创建新文件a.txt
fo.write("hello2") # 在a.txt中写入hello
fo = open('a.txt', 'r') # 打开a.txt用于读
fq = open('b.txt', 'a') # 创建b.txt用于写入
for line in fo:
fq.write(line) # 将a.txt内容追加至b.txt
fo.close()
fq.close()
通过这段代码,在根目录将生成两个文件,文件名分别为a.txt
,b.txt
。且两个文件中内容完全相同。
2.文本文件相关信息统计
编写一个程序,对任意给定文本文件中的制表符、行、空格进行计数。
- 代码(该脚本名称
file.py
):
import os
import sys
def parse_file(path):
"""
分析给定文本文件,返回其空格、制表符、行的相关信息
:arg path: 要分析的文本文件的路径
:return: 包含空格数、制表符数、行数的元组
"""
fd = open(path)
i = 0
spaces = 0
tabs = 0
for i, line in enumerate(fd):
spaces += line.count(' ')
tabs += line.count('\t')
# 现在关闭打开的文件
fd.close()
# 以元组形式返回结果
return spaces, tabs, i + 1
def main(path):
"""
函数用于打印文件分析结果
:arg path: 要分析的文本文件的路径
:return: 若文件存在则为 True,否则 False
"""
if os.path.exists(path):
spaces, tabs, lines = parse_file(path)
print("Spaces {}. tabs {}. lines {}".format(spaces, tabs, lines))
return True
else:
return False
if __name__ == '__main__':
if len(sys.argv) > 1:
main(sys.argv[1])
else:
sys.exit(-1)
sys.exit(0)
使用:
- 我们在项目根目录创建
sample.txt
:
图片描述- 输入快捷键
Win+R
并输入cmd
图片描述切换到项目根目录
图片描述- 输入
python file.py sample.txt
后敲击enter
即可运行
图片描述
- 拓展:在Pycharm中输入文件名输出文件信息统计
import os
import sys
def parse_file(file):
"""
分析给定文本文件,返回其空格、制表符、行的相关信息
:arg path: 要分析的文本文件的路径
:return: 包含空格数、制表符数、行数的元组
"""
i = 0
spaces = 0
tabs = 0
for i, line in enumerate(file):
spaces += line.count(' ')
tabs += line.count('\t')
# 以元组形式返回结果
return spaces, tabs, i + 1
def main(file):
"""
函数用于打印文件分析结果
:arg path: 要分析的文本文件的路径
:return: 若文件存在则为 True,否则 False
"""
if file:
spaces, tabs, lines = parse_file(file)
print("Spaces {}. tabs {}. lines {}".format(spaces, tabs, lines))
return True
else:
return 0
if __name__ == '__main__':
str = input("请输入文件名(包括扩展名):")
file = open(str)
# print(file)
# str_r = file.read()
main(file)
- 结果:
请输入文件名(包括扩展名):sample.txt
Spaces 2. tabs 3. lines 4
四、实验结果
1.提取文件中的字符串
{% note info no-icon %}
我们需要实现一个程序用来提取文件中的字符串中的数字,然后打印输出。
{% endnote %}
- 代码:
str = input("请输入文件名(包括扩展名):")
with open(str) as f:
s = f.read()
res = ""
for char in s:
if char.isdigit():
res += char
print(res)
- 结果:
请输入文件名(包括扩展名):sample.txt
456461
注:sample.txt的内容为
hello world!
Very good!
das45 646
1