「锟斤拷锟斤拷锟斤拷锟斤拷锟斤拷」到底是什么

2017-10-27  本文已影响81人  千罹

锟斤拷

是一种编码转换的错误转码,参考百度扩展阅读

utf-8 是一种变长的编码格式,最长为6个字节,最短为一个字节
gbk 是一种定长编码格式,汉字2个字节,字符1个字节

gbk 定长字符串转换成 utf-8 时,变成了 utf-8 解析不了的字符。例如:“�������й���”
而utf-8的变长字符“�”转换为定长字符gbk,为“\xef\xbf\xbd” 3个字符
经过多册重复 “��”,即:“\xef\xbf\xbd\xef\xbf\xbd” 6个字符
gbk 一个汉字2个字符

\xef\xbf == 0xEFBF == '锟'
\xbd\xef == 0xBDEF == '斤'
\xbf\xbd == 0xBFBD == '拷'
"��" === "锟斤拷"

如有纰漏,请指正

上一篇 下一篇

猜你喜欢

热点阅读