Unicode与utf-8那些事儿

2018-07-28  本文已影响11人  ZenCabin

什么是Unicode?

Unicode是一种旨在将一切字符编码到同一个编码体系的字符集规范,【官网链接】。Unicode给每一个字形一个独立的表示,叫做码点(code point),码点一般写作"U+xxxx",xxxx表示16进制的数字,例:U+54C8(汉字“哈”)。用途或意思相近的码点被划分到一个组里,叫做平面(plane),目前一共规定了17个平面,只有少数几个被使用到了。17个平面目前的分布为:

Unicode planes and used code point ranges(维基百科)

截止到Unicode 10.0,一共规定了136,690个不重复字符。

unicode 11.0字符分配表


unicode11_assigned_characters.png

什么是utf-8?

TODO xxx
utf-8是一种字符编码方式,是Unicode标准规范的一种实现。

上一篇 下一篇

猜你喜欢

热点阅读