简单介绍 unicode utf-8

2019-03-25  本文已影响0人  邪恶的奥伯伦

unicode 是一个把所有世界上的文字符号都统一包含的字符集,每一字符就是 码点/码位(code point)
比如 字符 a 在十六进制下是 61, 汉字 59d7

utf (Unicode Transformation Formats) 则是专门用于处理unicode的字符编码(Character encoding)

其中utf-32是固定32位长度的,完全与unicode的code point一一对应, 但是英文字母很短,汉字却很长,比如前面的a的区别, 如果都用32位表示 就会造成传输空间浪费。
utf-8是一种可变长度字符编码。

上一篇下一篇

猜你喜欢

热点阅读