Requests 高级用法
2018-06-13 本文已影响262人
北游_
1. 文件上传
使用 post 请求提交数据
import requests
# 文件上传 post请求
file = {'file': open('./uploadfile.png', 'rb')}
print("开始请求")
res = requests.post('http://httpbin.org/post', files=file)
res = res.text
print(res)
2.Cookies
-
获取 cookie
import requests res = requests.get('http://www.baidu.com') # 调用请求响应的cookies属性获取cookie cookies = res.cookies for key,values in cookies.items(): print(key,':',values)
-
设置 cookie 方法一:将 cookie 加入请求头 headers 中。
import requests # 方法一:cookie加入到headers请求头中 headers = { 'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/66.0.3359.139 Safari/537.36', 'Cookie': 'd_c0="AAAC8BK13wyPTmULuvtm0wkjbW5ZyeFirPE=|1513951174"; _zap=87e9c9e3-5dbd-418b-8ebc-230ab091ecb5; __DAYU_PP=ef6JrVABfZUAjb7bBFuv217bd0126e8c; _ga=GA1.2.661525257.1520666422; ……capsion_ticket="2|1:0|10:1528862525|14:capsion_ticket|44:NDI0ZmI5MDliMjJhNDE4YzlkMTUzY2IwMTA3Njg5YTE=|8658014fd601bdcc209fe2b13d74da5ecd597135f8709b7727d3c7d2a4f97612"', 'Host': 'www.zhihu.com' } # 注意此处请求url是https协议。 res = requests.get('https://www.zhihu.com', headers=headers) print(res.text)
-
设置 cookie 方法二:构造 RequestCookieJar 。
import requests cookies = 'd_c0="AAAC8BK13wyPTmULuvtm0wkjbW5ZyeFirPE=|1513951174"; _zap=87e9c9e3-5dbd-418b-8ebc-230ab091ecb5; __DAYU_PP=ef6JrVABfZUAjb7bBFuv217bd0126e8c; _ga=GA1.2.661525257.1520666422; l_cap_id="ODZmNzc0NTIwZDU3NGMwNTg3ZTExMjNmZWVmZTJiZmM=|1527817448|09c4b1d56078f428986cabddc6a314695ce7a463"; capsion_ticket="2|1:0|10:1528862525|14:capsion_ticket|44:NDI0ZmI5MDliMjJhNDE4YzlkMTUzY2IwMTA3Njg5YTE=|8658014fd601bdcc209fe2b13d74da5ecd597135f8709b7727d3c7d2a4f97612"' headers = { 'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/66.0.3359.139 Safari/537.36', 'Host': 'www.zhihu.com' } jar = requests.cookies.RequestsCookieJar() for cookie in cookies.split(';'): key, value = cookie.split('=', 1) jar.set(key,value) res = requests.get('https://www.zhihu.com', cookies=jar, headers=headers) print(res.text)
3.会话保持
使用Session对象,维护会话。
import requests
# 会话保持:不使用每次都传入cookie的方式
# 设置cookie
requests.get('http://httpbin.org/cookies/set/number/123456789')
# 获取网站cookie
res = requests.get('http://httpbin.org/cookies')
print(res.text)
## 上面的请求会话状态是不保存的(只是为了对比),下面的是正确用法
# 设置 Session 对象, 作用是维持同一个会话
s = requests.Session()
s.get('http://httpbin.org/cookies/set/number/123456789')
res = s.get('http://httpbin.org/cookies')
print(res.text)
4. SSL证书验证
- requests 提供了证书验证的功能,可以使用 verify 参数(布尔值)去控制是否检查证书。
import requests
# # SSL证书验证
# 请求时带入 verify 关键字,值为False。表示不验证证书
response = requests.get('https://www.12306.cn', verify=False)
print(response.status_code)
# 不过上面的请求会有如下警告,建议指定证书
# InsecureRequestWarning: Unverified HTTPS request is being made. Adding certificate verification is strongly advised. See: https://urllib3.readthedocs.io/en/latest/advanced-usage.html#ssl-warningsInsecureRequestWarning)
对于上述警告解决方法:
-
方案一:设置忽略警告的方式屏蔽这个警告
import requests from requests.packages import urllib3 urllib3.disable_warnings() response = requests.get('https://www.12306.cn', verify=False) print(response.status_code)
-
方案二:使用 logging模块 捕获警告到日志的方式忽略警告
import logging import requests logging.captureWarnings(True) response = requests.get('https://www.12306.cn', verify=False) print(response.status_code)
-
方案三:指定本地证书用作客户端证书,本地私有证书的 key 必须是解密状态,加密状态的key是不支持的
import requests response = requests.get('https://www.12306.cn', cert=('/path/server.crt', '/path/key')) print(response.status_code)
5. 代理设置
import requests
proxies = {
'http': 'http://1.12.32.1:2123',
'https': 'http:/1.12.32.1:2123'
}
response = requests.get('http://www.baidu.com/s?wd="ip"', proxies=proxies)
print(response.text)
6. requests.codes.ok
根据请求的响应码,执行响应的代码块
import requests
# 请求失败地址
res = requests.get('https://www.jianshu.com/u/31dsdfb6d')
# 请求成功地址
# res = requests.get('http://www.baidu.com')
if res.status_code == requests.codes.ok:
print('请求成功')
# 执行代码块
else:
print('请求失败')
# 执行代码块
7.超时设置
因网络问题,可能导致某些请求会一直等待下去。故需要设置超时
timeout 参数值有两种型式:
-
time : 整型,表示连接和读取这两者操作的 timeout 总和
-
(connect, read) 表示:连接超时时间和读取超时时间,默认值为None。
#如果你制订了一个单一的值作为 timeout,如下所示:
r = requests.get('https://github.com', timeout=5)
#这一 timeout 值将会用作 connect 和 read 二者的 timeout。如果要分别制定,就传入一个元组:
r = requests.get('https://github.com', timeout=(3.05, 27))
#如果远端服务器很慢,你可以让 Request 永远等待,传入一个 None 作为 timeout 值,然后就冲咖啡去吧。
r = requests.get('https://github.com', timeout=None)