彻底搞定乱码-乱码产生的原因-1

2019-10-05  本文已影响0人  dancer4code

1.什么是乱码?

指的是由于本地计算机在用文本编辑器打开源文件时,使用了不相应字符集而造成部分或所有字符无法被阅读的一系列字符。

2.乱码产生的原因?

编码与解码方式不统一(编码方式有很多种)
文件在保存时是有编码格式的,只有当保存时使用的编码格式与读取时使用的编码格式相同时才能正确读取文件;例如UTF-8编码、GBK编码都可以读取中文,那么如果采用UTF-8编码保存文件,但是采用GBK编码读取文件就会造成乱码,因此UTF-8编码保存的文件应该使用UTF-8编码读取;

3. 编码方式介绍

说到编码方式,就不能不说,计算机的存储单位以及进制(现有的系统基本是基于二进制的,只能识别1和0。现在我们看到的网页、视频、图片、文字.....都是构建在其上的。)

存储单位
1 Byte (字节)= 8 Bits(位,信息量的最小单位)
1 KB = 1024 Bytes
1 MB = 1024 KB
1 GB = 1024 MB
存储单位

进制
二进制
八进制
十进制
十六进制
进制

字符编码介绍

ASCII特殊字符解释.jpg

编码对比

编码对比.png

发展
ASCII(1字节)——>ISO8859-1(1字节)——>GB2312(2字节)——>GBK(2字节)——>unicode(utf-8(变长度编码),utf-16,utf-32)

编码方式.jpg
上一篇 下一篇

猜你喜欢

热点阅读