python内置爬虫请求模块-urllib

2020-07-26  本文已影响0人  livein80

1.爬虫请求模块urllib.request

2.urllib.parse模块

-2.1请求方式

 import ssl
 import urllib.request
 import urllib.parse
 context = ssl._create_unverified_context()
 headers={
        'User-Agent': 'Mozilla/5.0 (Macintosh; Intel Mac OS X 10_14_3) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/84.0.4147.89 Safari/537.36'
    }
  # 发起请求 获取响应
 req = urllib.request.Request(url,headers=headers) #重新构建一个Request请求
 res = urllib.request.urlopen(req,context=context) # 传入上下文参数:context,以解决证书无法验证问题
 html = res.read().decode('utf-8') # 获取文本形式上的内容
上一篇 下一篇

猜你喜欢

热点阅读