《Fluent Python》读书笔记

《Fluent Python》读书笔记-Text versus

2019-01-25  本文已影响0人  雨天独行

概览

    "string"的概念很简单,就是字符的序列。但是怎么定义字符是一个问题。在python3,str是由Unicode字符组成,而在python2里str是由原始的byte字符组成。
    Unicode标准把字符的标识和字符的二进制表示区分开来:

字符编码的各式各样的问题

    本章后面讲了很多因为字符编码产生的问题,在目前做过的项目中基本没碰到过,感觉主要出现在像希腊语,葡萄牙语还有泰米尔语这类语言上,也没去深入研究,简单做下总结。

>>> import struct
>>> fmt = '<3s3sHH' #
>>> with open('filter.gif', 'rb') as fp: ... img = memoryview(fp.read()) # ...
>>> header = img[:10] #
>>> bytes(header) # b'GIF89a+\x02\xe6\x00'
>>> struct.unpack(fmt, header) # (b'GIF', b'89a', 555, 230)
>>> del header #
>>> del img
上一篇 下一篇

猜你喜欢

热点阅读