Python挤牙膏

字符编码

2018-12-07  本文已影响0人  范py

-文件处理
cpu:
内存:暂时存储
硬盘:
在编写python程序时无语法概念,不会报错。别写结果和编写一个普通的文本文件没有区别。只有把python程序交给python解释器并且交给第三个阶段才有了语言意义。
-python解释器执行python程序
第一阶段:先启动
第二阶段:把文件读入内存
第三阶段:解释执行,识别语法
-文本编辑器读的原理

什么是字符编码

人类字符>翻译机器认识的0,1二进制
一个英文字母占8个byte位。(ASCII)
GBK 16
unicode:两个字节表示一个字符
保证不乱码的核心,用什么存就用什么取。
我们能控制存到硬盘上的编码。
python3解释器默认utf-8编码

执行python第三个阶段发生的故事

会识别python语法,定义的字符串有涉及到字符编码的概念

转换

unicode---编码code--》GBK
GBK----解码---》unicode
x.code("gbk")解码unicode
python3 字符串类型 str:默认被存成unicode
python3 bytes类型
Unicode 》编码Unicode》utf-8
utf-8 》解码》Unicode
x= ‘你好’
res = x.encode(“utf-8”)

print(res.decode(“unicode”)
Unicode 不能存到硬盘,所以需要编码到utf-8
bytes类型二进制数据》可以往硬盘内写。
bytes用途:
1,存放在文件中
2,基于网络传输

上一篇下一篇

猜你喜欢

热点阅读