程序员工具癖

python的文件操作

2018-12-14  本文已影响1人  我只是我笔下的小丑

0. 概述

文件的操作:
关于一个文件的一生:

文件的诞生,创建文件。在linux下可以使用touch、vim等命令进行创建。使用python,可以使用open的操作进行创建。
文件的修改,此处只说明python的相关操作。

  1. 打开文件,open()
  2. 修改文件,write()
  3. 读取文件,read()
  4. 关闭文件,close()

文件的结束。linux下使用rm命令进行删除。

1.open

open(file,mode='r',buffering=-1,encoding=None,errors=None,newline=None,closefd=True,opener=None)

open()是相关操作中参数最多,也是最复杂的一个方法。
file:文件名称;
mode:打开文件时候,文件具有的属性;
buffering:缓冲区;
encoding: 编码,仅文本模式使用;
errors:什么样的编码会被屏蔽;
newline:换行符的转换,进文本模式使用;
closefd:关闭文件描述符;
opener:

其中最常使用的是前5个参数,文件名不可缺省。各项缺省值如下:
open(file,mode='r',buffering=-1,encoding=None,errors=None,newline=None,closefd=True,opener=None)

1. file

此处使用文件的相对路径和绝对路径均可,建议使用绝对路径。
如果不指定路径,则默认当前路径。当前路径也是相对路径开始的地方。

2. mode

文件访问的两种模式:

  1. 文本模式
    连续的字符,字符流。按照字符处理。
  2. 二进制模式
    字节流,将文件按照字节理解。

mode
r:只读打开,不存在会抛出异常,默认(正常思维的打开方式);

w:只写打开,文件不存在时候创建,文件存时且有内容就先清空。 只写(永远打开的是一个空文件);
x:创建文件,并且只写打开,文件存在则报错。 只写(文件不能存在,创建并打开的是一个空文件);
a:文件存在,则追加。文件不存在时候,创建文件。 只写(永远都是写在最后);
b:使用二进制模式打开;
t:缺省的,使用文本模式打开;
+ 读写打开一个文件,给原来只读。只写方式打开提供,缺省的读写能力。

只写打开的文件是不能读的。

程序是如何定位打开时候的位置呢?
文件内部都维护了一个指针,可以理解为windows下的光标位置。
当:
mode = r,指针(光标)放在文本的最前面。可以从开始一个一个的读出来。
mode = a,指针(光标)放在文本的最后边。如果此时加一个可读的权限,能读出来什么呢?

tell() 可以告诉我,这个这个打开的文件的指针位置。

f = open('../tmp/test','a+')
print(f.tell())
print(f.writable())  
print(f.read())  

f.close()
##说明1:此处文本的内容为:i love python
##说明2:打开的文件使用完毕后必须第一时间调用close关闭。
14
True

3. seek()

seek() 英文意思:往或朝…而去,此处可以移动我们的指针(光标)。
seek(offest,[whence])
offest:偏移的字节量;
whence:从什么位置开始。

seek控制字节是很好使用的,但是文本模式下就很麻烦了。
文本模式下:
whence 0:缺省值,此时offest只能是正整数;
whence 1:表示当前位置开始,offest只能是0(毫无意义);
whence 2:表示从末尾开始,offest只能说0。

文本模式

f = open('../tmp/test','a+')  #默认是文本模式
print(f.tell())
f.seek(1) #表示指针移到第二个字节开始的位置。
print(f.tell())
print(f.writable())  
print(f.read())  
f.close()
14
1
True
 love python

字符模式

f = open('../tmp/test1','ab+')  #b是bytes的缩写,字节模式
print(f.tell())
f.seek(-10,2)  #从末尾位置向前移到10个字符,1表示当前位置,0是默认值,不能接受负数了。
print(f.tell())
print(f.read()) 
f.close()

##文件内容是:我爱python,向前移动10个字符。python\n是7个字符,爱是三个字符。

print(b'\xe7\x88\xb1'.decode())

##说明:二进制模式下,seek不允许向前超界,向后允许。
13
3
b'\xe7\x88\xb1python\n'
爱

4. buffering

buffering参数是写入文件时候的缓冲控制,文件写入的时候先保存到内存中,当存到一定的数量时候,就会写入硬盘。
缺省值是 -1。
二进制模式下,默认大小是4096或者8192个字节。
文本模式下,如果说终端设备,行缓存模式。非终端设备,使用二进制策略,一个汉字大多数算三个字符。

  1. buffering = 0 只在二进制模式下使用,关闭buffer;
  2. buffering = 1 只在文本模式下使用,表示开启行缓冲,见到换行符就保存(flush)到硬盘中;
  3. buffering > 1 用于指定buffer的大小。
# 查看默认的缓存区大小
import io
f = open('../tmp/test1','ab+')
print(io.DEFAULT_BUFFER_SIZE)


8192

注意:

  1. 文本模式,一般都使用默认缓冲区大小;
  2. 二进制模式,都是一个个字节的操作,可以指定buffer的大小;
  3. 一般来说,默认缓冲区大小说个比较好的选择,除非明确知道要干什么;
  4. 一般编程中,明知道需要写入磁盘,都会手动调用flush操作。

flush()

把缓存全部写入磁盘,调用close关闭文件时,会自动先执行一次flush再关闭文件。

2. write()

write(s)把字符串s写入到文件中保存并返回字符个数。

3. read()

read(size=-1)
size表示读取多少个字符(t模式)或者字节(b模式)出来,负数或者None表示从指针处全部读出。

f = open('../tmp/test1','r+')  #b是bytes的缩写,字节模式
f.seek(6)  #移动两个汉字,6个字符
print(f.read(6)) 
f.close()

#文本内容,我爱python
python

readline(size=-1)
使用一次读取一行的内容;

f = open('../tmp/test2','r+')  #b是bytes的缩写,字节模式

print(f.readline()) 
print(f.readline()) 
f.close()

#文本内容:
# 我爱python
# i my mykernel
我爱python

i my mykernel

readlines(size=-1)
一次性读出所有的行,并以列表的形式输出;

f = open('../tmp/test2','r+')  #b是bytes的缩写,字节模式

print(f.readlines()) 
f.close()

#文本内容:
# 我爱python
# i my mykernel
['我爱python\n', 'i my mykernel\n']

4. close()

close()

关闭打开中的文件,如果文件并未打开,调用了也不会产生异常。

5. 其他

seekable() 测试是否可seek
readable() 测试是否可读
writable() 测试是否可写
closed 测试是否已经关闭

f = open('../tmp/test2','r+')  #b是bytes的缩写,字节模式

print(f.seekable())
print(f.readable())
print(f.writable())
print(f.closed)
print(f.readlines()) 

f.close()
print(f.closed)
#文本内容:
# 我爱python
# i my mykernel
True
True
True
False
['我爱python\n', 'i my mykernel\n']
True
f = open('../tmp/test2','r')  #b是bytes的缩写,字节模式

print(f.seekable())
print(f.readable())
print(f.writable())
print(f.closed)
print(f.readlines()) 

f.close()
print(f.closed)
#文本内容:
# 我爱python
# i my mykernel
True
True
False
False
['我爱python\n', 'i my mykernel\n']
True
f = open('../tmp/test2','a')  #b是bytes的缩写,字节模式

print(f.seekable())
print(f.readable())
print(f.writable())
print(f.closed)
f.close()
print(f.closed)
#文本内容:
# 我爱python
# i my mykernel
True
False
True
False
True

更多欢迎访问:http://www.mykernel.cn/

上一篇下一篇

猜你喜欢

热点阅读