关于python 3.X下的urllib,urllib2的使用

2018-07-17  本文已影响0人  carebon

先贴一段笔者之前的代码
···
def load_page(url):

# ...
#     发送url请求
#     返回url请求html页面
# ...
user_agent="Mozilla/5.0(compatible; MSIE 9.0; Window NT 6.1; Trident/5.0;"
hearers = { "User_Agent":user_agent}

req = urllib.request.Request(url, headers = hearers)

response = urllib.request.urlopen(req)

html = response.read()
# print (html)
return html

···

在python 3.X下,urllib2.request被替换为urllib.request.Request,urllib2.urlopen被替换被urllib.request.urlopen。也就是现在的urllib拥有之前的urllib和urllib2的功能。

Python3 如何对url解码?实现Python2中urllib.unquote的作用?

Python2中,对url解码 可以这样做:

print urllib.unquote("%E6%B5%8B%E8%AF%95abc")

python3取消unquote属性

可以这样做:

import urllib.parse

print(urllib.parse.unquote("%E6%B5%8B%E8%AF%95abc"))

上一篇下一篇

猜你喜欢

热点阅读