编码

python编码

2018-12-13  本文已影响0人  xiaoshengMar
  • 只有英文
  • 一个字符占8位,是1个字节
  • 英文一个字符占32位,是4个字节
  • 中文一个字符占32位,是4个字节
  • 英文中一个字符占8位,是1个字节
  • 中文中一个字符占24位,是3个字节
  • 英文中一个字符占8位,是1个字节
  • 中文中一个字符占16位,是2个字节

注意:

python3中:

  • str:
      表现形式:s = 'alex'
      编码方式:Unicode
  • bytes:
      表现形式:s = b'alex'
      编码方式:可能是utf-8或者gbk或者其他,但不会是Unicode
  • str:
      表现形式:s = '小生'
      编码方式:Unicode
  • bytes:
      表现形式:s = b'x\e91\e23'
      编码方式:可能是utf-8或者gbk或者其他,但不会是Unicode

s1 = 'xiaosheng'
new_s1 = s1.encode('utf-8')
print(new_s1)   # b'xiaosheng'

s2 = '小生'
new_s2 = s2.encode('utf-8')
print(new_s2)  # b'\xe5\xb0\x8f\xe7\x94\x9f'

s3 = '小生'
new_s3 = s3.encode('gbk')
print(new_s3)   # b'\xd0\xa1\xc9\xfa'
上一篇下一篇

猜你喜欢

热点阅读