第四章
2018-10-10 本文已影响8人
Oppenheim
Unicode 字符 utf-8编码方式 4位 32字节
unicode三明治:1.解码输入的字节序列(bytes>str)2.只处理文本 3.编码输出的文本。
编码方式不一样 长度是不一样的 len()
nfc 最少码位构成的等价字符串
nfd 基字符串和单独的组合字符
Unicode 字符 utf-8编码方式 4位 32字节
unicode三明治:1.解码输入的字节序列(bytes>str)2.只处理文本 3.编码输出的文本。
编码方式不一样 长度是不一样的 len()
nfc 最少码位构成的等价字符串
nfd 基字符串和单独的组合字符