Python全栈工程师

20.3-文件指针操作

2019-09-24  本文已影响0人  BeautifulSoulpy

我贵而人奉之,奉此峨冠大带也;我贱而人侮之,侮此布衣草履也。然则原非奉我,我胡为喜?原非侮我,我胡为怒? ——菜根谭

大意是: 我有权有势人们就奉承我,这是奉承我的官位和纱帽;我贫穷低贱人们就轻视我,这是轻视我的布衣和草鞋。可见根本不是奉承我,我为什么要高兴呢?根本不是轻视我,我又为什么要生气呢?

所以做到宠辱不惊,才是行走天地间的不二法则。

Python的指针:有什么意义?

文件I\O 调用的是操作系统的功能,跟python无关;

本章总结:

  1. window 默认的编码是gbk,Linux 默认的编码是 UTF-8;
  2. 二进制模式支持任意起点的偏移;向前seek的时候,不能超界;
  3. 在字节的世界里,没有字符文本的概念的;在字符的世界里,是有编码的概念的;
文件指针

文件指针,指向当前字节位置; 一般移动到开头或结尾;不建议中间的移动操作;

模式 描述
r 以只读方式打开文件。文件的指针将会放在文件的开头。这是默认模式。
rb 以二进制格式打开一个文件用于只读。文件指针将会放在文件的开头。这是默认模式。
r+ 打开一个文件用于读写。文件指针将会放在文件的开头。
rb+ 以二进制格式打开一个文件用于读写。文件指针将会放在文件的开头。
w 打开一个文件只用于写入。如果该文件已存在则将其覆盖。如果该文件不存在,创建新文件。
wb 以二进制格式打开一个文件只用于写入。如果该文件已存在则将其覆盖。如果该文件不存在,创建新文件。
w+ 打开一个文件用于读写。如果该文件已存在则将其覆盖。如果该文件不存在,创建新文件。
wb+ 以二进制格式打开一个文件用于读写。如果该文件已存在则将其覆盖。如果该文件不存在,创建新文件。
a 打开一个文件用于追加。如果该文件已存在,文件指针将会放在文件的结尾。也就是说,新的内容将会被写入到已有内容之后。如果该文件不存在,创建新文件进行写入。
ab 以二进制格式打开一个文件用于追加。如果该文件已存在,文件指针将会放在文件的结尾。也就是说,新的内容将会被写入到已有内容之后。如果该文件不存在,创建新文件进行写入。
a+ 打开一个文件用于读写。如果该文件已存在,文件指针将会放在文件的结尾。文件打开时会是追加模式。如果该文件不存在,创建新文件用于读写。
ab+ 以二进制格式打开一个文件用于追加。如果该文件已存在,文件指针将会放在文件的结尾。如果该文件不存在,创建新文件用于读写。

tell() 与 seek()

tell() 显示指针当前位置

seek()
seek(offset[, whence]) 移动文件指针位置。offest偏移多少字节,whence从哪里开始。

offset -- 开始的偏移量,也就是代表需要移动偏移的字节数,如果是负数表示从倒数第几位开始。

whence:可选,默认值为 0。给 offset 定义一个参数,表示要从哪个位置开始偏移;0 代表从文件开头开始算起,1 代表从当前位置开始算起,2 代表从文件末尾算起。

f = open("test4.txt",'r+')
f.tell() | 0
f.read() | 'magedu'
f.seek(2,0)  |   2
f.read()       |   'gedu'
f.seek(200,0)    |   200
f.tell(200,0)     |    200
f.read()    |     ''
f.close()
文本模式下

可以挪动指针的位置,非二进制不可以使用负索引;

# 文本模式
f = open('test4','r+')
f.tell() # 起始
f.read()
f.tell() # EOF
f.seek(0) # 起始
f.read()
f.seek(2,0)
f.read()
f.seek(2,0)
f.seek(2,1) # offset必须为0
f.seek(2,2) # offset必须为0
f.close()

# 中文
f = open('test4','w+')
f.write('马哥教育')
f.tell()
f.close()
f = open('test4','
f.read(2)
f.seek(1)
f.tell()
f.read() #
f.seek(2) # f.seek
f.close()

二进制模式

1. 二进制模式支持任意起点的偏移

从头、从尾、从中间位置开始。 向后seek可以超界,但是向前seek的时候,不能超界,否则抛异常

2. 伸长的空间可以拉回来
3. 相对位置,相对于头尾,不能超界;

# 二进制模式
f = open('test4','rb+')
f.tell() # 起始
f.read()
f.tell() # EOF
f.write(b'abc')
f.seek(0) # 起始
f.seek(2,1) # 从当前指针开始,向后2
f.read()
f.seek(-2,1) # 从当前指针开始,向前2
f.seek(2,2) # 从EOF开始,向后2
f.seek(0)
f.seek(-2,2) # 从EOF开始,向前2
f.read()

f.seek(-20,2) # OSError
f.close()

在字节的世界里,没有字符文本的概念的;在字符的世界里,是有编码的概念的;
在有中文的情况下,少用文件指针操作;

二进制下,文件指针跟字符没关系,

1. 二进制模式下,字节模式下移动的基本单位是单字节;

f = open('test4', 'wb+')
f.write('教育'.encode())   |  6       #   UNICODE通过编码(encode)可以转换成UTF8编码占3个字节;
f.tell()  |    6
f.seek(0)    |   0
f.tell()      |    0
f.seek(1)      |     1
f.read()        |     b'\x95\x99\xe8\x82\xb2'
f.seek(0)   |   0
f.read()    |    b'\xe6\x95\x99\xe8\x82\xb2'

上一篇 下一篇

猜你喜欢

热点阅读