关于python中文件和数据的处理
2020-06-01 本文已影响0人
脏脏的小泥娃
文件分为文本文件和二进制文件,文件的处理步骤是:打开-操作-关闭。
- 文件打开
文件打开使用:<变量名> = f.open(<文件名>,<打开模式>)
- 文件的路径和名称:由于在Windows平台文件路径中使用的是 \ ,而python语言中 \ 是转义符,所以文件打开的时候路径中出现的 \ 需要转换成 / 或者使用 \\。
- 打开模式:打开模式包括以文本形式打开和以二进制形式打开,打开过程是读信息还是写信息。python提供了几种文件打开模式。分别是:
- 'r' 只读模式,默认值,如果文件不存在,返回FileNotFoundError
- 'w' 覆盖写模式,文件不存在则创建,存在则完全覆盖
- 'x' 创建写模式,文件不存在则创建,存在则返回FileExistsError
- 'a' 追加写模式,文件不存在则创建,存在则在文件最后追加内容
- 'b' 二进制文件模式
- 't' 文本文件模式。默认值
- '+' 与r/w/x/a一同使用,在原功能基础上同时增加读写功能
例如:
f.open("f.txt")#文本形式、只读模式、默认值
f.open("f.txt", "rt")#文本形式、只读模式、同默认值
f.open("f.txt", "w")#文本形式、覆盖写模式
f.open("f.txt", "a+")#文本形式、追加写模式+读文件
f.open("f.txt", "x")#文本形式、创建写模式
f.open("f.txt", "b")#二进制形式、只读模式
f.open("f.txt", "wb")#二进制形式、覆盖写模式
- 文件操作:读和写
- 读文件函数:f.read(size)、f.readline(size)、f.readlines(hint)
f.read(size=-1)#读入全部内容,如果给出参数size,读入前size长度
f.readline(size=-1)#读入一行内容,如果给出参数,读入改行前size长度
f.readlines(hint=-1)#读入文件所有行,以每行为元素形成列表,如果给出参数,读入前hint行
例如:
#遍历全文本,方法1
fname = input("请输入要打开的文件名称")
fo = open(fname,"r")
txt = fo.read()#遍历全文本的一种方法,一次读入,统一处理
fo.close()
#遍历全文本,方法2
fname = input("请输入要打开的文件名称")
fo = open(fname,"r")
txt = fo.read(2)#每次读入两个字节
while txt != " ":
txt = fo.read(2)#按数量读入,逐步处理
fo.close()
#逐行遍历文件:方法1
fname = input("请输入要打开的文件名称:")
fo = open(fname, "r")
for line in fo.readlines()#一次读入,分行处理
print(line)
fo.close()
#逐行遍历文件:方法2
fname = input("请输入要打开的文件名称:")
fo = open(fname, "r")
for line in fo:#分行读入,逐行处理
print(line)
fo.close()
- 写文件函数:f.write(s)、f.writelines(lines)、f.seek(offset)
f.write(s)#向文件写入一个字符串或字节流
f.writelines(lines)#将一个元素全为字符串的列表写入文件
f.seek(offset)#改变当前文件操作指针的位置,
#offset含义如下:0-文件开头;1-当前位置;2-文件结尾
例如:
fo = open("output.txt", "w+")
ls = ["中国","法国","美国"]
fo.writelines(ls)#写入一行字符串列表
for line in fo:
print(ls)
#print预期输出是“中国法国美国”,实际上没有任何输出。
#因为此时写入信息后文件指针在文件写入后的位置,而写入的信息在指针上方而不是下方,此时应将指针改变到写入信息的上方方可遍历输出
fo.close()
#改变后的代码
fo = open("output.txt", "w+")
ls = ["中国","法国","美国"]
fo.writelines(ls)
fo.seek(0)#让指针回到文件的初始位置
for line in fo:
print(ls)#输出“中国法国美国”
fo.close()
- 文件关闭
<变量名>.close()
一维数据对应列表、数组和集合等概念,二维数据由多个一维数据构成,是一维数据的组合形式。多维数据由一维或二维数据在新维度上扩展形成。高维数据:仅利用最基本的二元关系(键值对)展示数据间的复杂结构。
- 数据的操作周期:存储(存储格式)-表示(数据类型)-操作(操作方式)
- 一维数据
1 一维数据的表示:
如果数据间有序:使用列表类型
如果数据间无序:使用集合类型
2 一维数据的存储:
存储方式1:空格分隔,不换行。缺点:数据中不能存在空格
存储方式2:逗号分隔,不换行。缺点:数据中不能存在逗号
存储方式3:使用其他特殊符号或符号组合分隔。缺点:需要根据数据特点定义,通用性较差。
3 一维数据的处理:
这里的处理是指将存储的数据读入程序或将程序表示的数据写入文件。
例如:
#从空格分隔的文件中读入数据
txt = open(fname).read()
ls = txt.split()
f.close()
#采用空格分隔方式写入数据
ls = ["中国","美国","日本"]
f = open(fname,"w")
f.write(" ".join(ls))
#join方法是将join前面的字符串分割放置到后边的join参数中的各个元素之间
f.close()
- 二维数据
1 二维数据的表示:
使用列表(二维列表)表达二维数据,使用两层for循环遍历每个元素
2 CSV格式与二维数据存储
- CSV格式:使用逗号分隔值的一种存储方式,为国际通用的一二维存储格式,以.csv作为扩展名。其中每行一个一维数据,采用逗号分隔,无空行。若某个元素缺失,逗号仍要保留,其中的逗号采用的是英文半角符号,逗号与数据之间无额外空格。
二维数据存储:既可以按行存,也可以按列存。一般先行后列。
3 二维数据的处理
#读入处理:从CSV文件中读入数据
fo = open(fname)
ls = [ ]
for line in fo :
line = line.replace("\n"," ")#将数据每行最后一个回车符换成空格
ls.append(line.split(","))
fo.close()
#写入处理:将数据写入CSV格式的文件
ls =[[ ],[ ],[ ]]#二维列表
f = open(fname, 'w')
for item in ls:
f.write(" ".join(item)+"\n")
f.close()
#二维数据的逐一遍历
ls = [[1,2],[3,4],[5,6]]#二维列表
for row in ls:
for column in row:
print(column)
- eg1: 题目来自python123.io平台
#参考代码
f = open("latex.log")
s, c = 0, 0
for line in f:
line = line.strip("\n")
if line == "":
continue
s += len(line)
c += 1
print(round(s/c))
- eg2: 题目来自python123.io平台
#参考代码
f = open("data.csv")
ls = f.readlines()
ls = ls[::-1]
lt = []
for item in ls:
item = item.strip("\n")#去掉每行最后的换行符
item = item.replace(" ", "")#去掉每行元素两侧的空格
lt = item.split(",")
lt = lt[::-1]
print(";".join(lt))
f.close()