字符编码表CEF
2019-07-14 本文已影响0人
Devil兵
字符编码表CEF
已经有了编码字符集,且这个字符集中的每个字符都有一个非负整数码位与之一一对应。是否解决所有问题了呢?答案是否定的。因为UCS是一个开放字符集,未来可能有更多的符号加入到这个字符集中来。也就是说UCS需要的码位,理论上是无限的。但计算机整形能表示的整数范围是有限的。一对有限与无限的矛盾,必须通过一种方式进行调和。这个解决方案,就是字符编码表(Character Encoding Form)。
字符编码表将码位(Code Point)映射为码元序列(Code Unit Sequences)。
码元
码元是能用于处理或交换编码文本的最小比特组合。通常计算机处理字符的码元为一字节,即8bit。
在Unicode中,指定了三种标准的字符编码表,UTF-8, UTF-16, UTF-32。分别将Unicode标量值映射为比特数为8、16、32的码元的序列。