Unicode

2018-06-22  本文已影响0人  寻亦追忆

Unicode为每个字符编号
UTF8规则以何种方式将Unicode编号存储到计算机中。
问题:例如「知」的码位是 30693,对应的二进制数为0111 0111 1110 0101,能不能把这个二进制码直接存储到计算机中?
回答:可以,这就是UTF16的编码规则,UTF16以二字节表示所有的Unicode码位,但是如果Unicode码位大于65536,二字节就表示不了了,这就是UTF16所存在的问题。
UTF8可以用1-4个字节表示Unicode码位,每个字节的前缀用来标示当前的码位对应的是几个字节,这样就可以实现字节变长。

Unicode(UTF-8, UTF-16)令人混淆的概念

上一篇下一篇

猜你喜欢

热点阅读