字符串和字符编码
2015-12-26 本文已影响41人
无名氏_1
基础知识回顾 :
1byte = 8 bit
Int32 = 32byte
ASCII编码 占1个byte 最多表示255(2的8次幂-1)个数
GB2312编码 汉字编码 占2个byte 最多表示65535(2的16次幂-1)个数
Unicode编码 将所有不同语言的编码标准统一到一个格式中 避免乱码的问题
Unicode编码通常2个byte表示一个字符(特殊的使用四个)
Utf-8编码 根据字符具体内容不同分配1-6个byte 比如英文字母1个byte 汉字则是3个byte 使用这种编码的好处是 节省空间 传输时更高效率
在计算机内存中 统一使用Unicode编码
场景1: 使用记事本记录文件
将记事本文件的Utf-8编码 转换为Unicode编码 读取到内存中
内存产生新的字符再以Utf-8的编码标准 写入记事本
场景2:服务器数据通过网页展示
将字符以Utf-8编码格式发送到客户端浏览器 客户端显示
python3
Python3中de字符串是使用Unicode编码的
<code>ord('')//将某个字符的Unicode编码打印出来</code>
<code>chr()//将某个编码对应的字符打印出来</code>
swift 中使用unicode编码打印出字符
如<code>print("\u{E9}\u{20DD}")</code>
unicode编码表