Python编码问题解决办法

2017-06-30  本文已影响0人  peng_js

①抓数据前先看html页面的字符集 utf-8/gbk/gb2312

②如果是utf8 在cmd下看会乱码 但是不影响逻辑判断和插入数据库

如果requests请求的话 :

r=requests.get(urls)

解析utf8字符集

c=pq(r.content.decode('utf8',"ignore"))

设置编码utf8

no_search=no_search.encode("utf8")

③如果是gbk/gb2312的话

r=requests.get(final_url)

解析gbk字符集

d=pq(r.content.decode('gbk',"ignore"))

编码utf8

xx=xx.encode('utf8')

注意如果还是乱码的话 在decode解析utf8就行

上一篇下一篇

猜你喜欢

热点阅读