字符编码方案

2019-07-14  本文已影响0人  Quillagua

字符编码方案

简单说,字符编码方案 CES 等于 字符编码表CEF 加上字节序列化的方案。也就是说,通过CEF得到码元序列,还需要对其字节排序,得到的就是最后的编码结果。

对于一个字符按照UTF16拆成了若干个码元组成的码元序列,因为每个码元都是一个unsigned short,实际上是两个字节。因此将码元序列化为字节序列的时候,就会遇到一些问题。

大小端序问题:每个码元究竟是高位字节在前还是低位字节在前呢?

字节序标记问题:另一个程序如何知道当文本是什么端序的呢?这些都是CEF需要操心的问题。

上一篇下一篇

猜你喜欢

热点阅读