sys.setdefaultencoding('uft8
2018-03-03 本文已影响9人
shuff1e
#!/usr/bin/env python
# -*- coding: utf-8 -*-
#作用是定义源代码的编码. 如果没有定义, 此源码中是不可以包含中文字符串的.
import sys
reload(sys)
sys.setdefaultencoding('utf8') #是设置默认的string的编码格式
- 我们在交互式命令行中看看解码,编码和字符集的关系
>>> str='中文'
>>> print str
中文
>>> str
'\xe4\xb8\xad\xe6\x96\x87'
>>> type(str)
<type 'str'>
>>> str.decode('utf8')
u'\u4e2d\u6587'
>>> print u'\u4e2d\u6587'
中文
>>> str.encode('utf8')
'\xe4\xb8\xad\xe6\x96\x87'
>>> print '\xe4\xb8\xad\xe6\x96\x87'
中文
>>>str2=str.decode('utf8').encode('gb2312')
>>> print str2
>>> str2
'\xd6\xd0\xce\xc4'
>>> str2.decode('gb2312')
u'\u4e2d\u6587'
>>> str3=str.encode('gb2312')
>>> print str3
>>> str3
'\xd6\xd0\xce\xc4'
>>> str3.decode('gb2312')
u'\u4e2d\u6587'