字符和编码

2019-05-23  本文已影响0人  ClementCJ
1. ASCII
2.Unicode
3.UTF-8

综上所述,文件在内存编码为Unicode,在存储空间中存储为指定的编码格式如UTF-8, ascii, GB2312等。

举个栗子:

字符串s,存储格式为UTF-8,转换为GB2313

# s先解码为Unicode,把从Unicode编码为GB2313
>>> s.decode('utf-8').encode('GB2312')
4.python中的codecs模块的open()方法,通过解码文本的编码格式为Unicode来处理文本
import codecs
# 把title.txt中的内容从utf-8解码为Unicode
with codecs.open('title.txt', 'r', 'utf-8') as f:
    names = f.read()
上一篇 下一篇

猜你喜欢

热点阅读