二进制文件处理时
2018-06-27 本文已影响11人
JinMoon
我们使用处理二进制文件时,需要用如下方法:
- binfile=open(filepath,'rb')
- binfile=open(filepath,'wb')
这两种二进制读写方式和文本方式读写的结果有何不同呢?
- binfile=open(filepath,'w')
- binfile=open(filepath,'r')
不同之处有两个地方:
-
使用'r'的时候如果碰到'0x1A',就会视为文件结束,这就是EOF。使用'rb'则不存在这个问题。即,如果你用二进制写入再用文本读出的话,如果其中存在'0X1A',就只会读出文件的一部分,而使用'rb'的时候会一直读到文件末尾。
-
对于字符串x='abc\ndef',我们可用len(x)得到它的长度为7,\n我们称之为换行符,实际上是'0X0A'。当我们用'w'即文本方式写的时候,在windows平台上会自动将'0X0A'变成两个字符'0X0D','0X0A',即文件长度实际上变成8.。当用'r'文本方式读取时,又自动的转换成原来的换行符。如果换成'wb'二进制方式来写的话,则会保持一个字符不变,读取时也是原样读取。所以如果用文本方式写入,用二进制方式读取的话,就要考虑这多出的一个字节了。'0X0D'又称回车符。linux下不会变。因为linux只使用'0X0A'来表示换行。