web接口自动化--requests库使用
2021-09-30 本文已影响0人
D_w
转自 临渊的博客 https://www.cnblogs.com/superhin/p/10338930.html
在接口自动化中使用requests库发送http请求更简单,支持自动编码解码,会话保持,长连等。
requests使用
最简单的GET请求
发送一个请求分3步:
- 组装请求: 请求可能包含url,params(url参数),data(请求数据),headers(请求头),cookies等,最少必须有url
- 发送请求,获取响应:支持get,post等各种方法发送,返回的是一个响应对象
- 解析响应: 输出响应文本
# 导入requests包
import requests
# 1. 组装请求
url = "http://httpbin.org/get" # 这里只有url,字符串格式
# 2. 发送请求,获取响应
res = requests.get(url) # res即返回的响应对象
# 3. 解析响应
print(res.text) # 输出响应的文本
带参数的GET请求
import requests
url = "http://www.tuling123.com/openapi/api?key=ec961279f453459b9248f0aeb6600bbe&info=你好" # 参数可以写到url里
res = requests.get(url=url) # 第一个url指get方法的参数,第二个url指上一行我们定义的接口地址
print(res.text)
或
import requests
url = "http://www.tuling123.com/openapi/api"
params = {"key":"ec961279f453459b9248f0aeb6600bbe","info":"你好"} # 字典格式,单独提出来,方便参数的添加修改等操作
res = requests.get(url=url, params=params) # 这里的params只接受字典类型
print(res.text)
get方法的params只接受字典类型
传统表单类POST请求(x-www-form-urlencoded)
import requests
url = "http://httpbin.org/post"
data = {"name": "hanzhichao", "age": 18} # Post请求发送的数据,字典格式
res = requests.post(url=url, data=data) # 这里使用post方法,参数和get方法一样
print(res.text)
JSON类型的POST请求(application/json)json可以理解为字典的字符串型
import requests
url = "http://httpbin.org/post"
data = '''{
"name": "hanzhichao",
"age": 18
}''' # 多行文本, 字符串格式,也可以单行(注意外层有引号,为字符串) data = '{"name": "hanzhichao", "age": 18}'
res = requests.post(url=url, data=data) # data支持字典或字符串
print(res.text)
post方法的data参数支持字典和字符串型(json)
如果data以字符串格式传输需要遵循以下几点:
- 必须是严格的JSON格式字符串,里面必须用双引号,k-v之间必须有逗号,布尔值必须是小写的true/false等等
- 不能有中文,直接传字符串不会自动编码
一般来说,建议将data声明为字典格式(方便数据添加修改),然后再用json.dumps()方法把data转换为合法的JSON字符串格式,如下
import requests
import json # 使用到JSON中的方法,需要提前导入
url = "http://httpbin.org/post"
data = {
"name": "hanzhichao",
"age": 18
} # 字典格式,方便添加
headers = {"Content-Type":"application/json"} # 严格来说,我们需要在请求头里声明我们发送的格式
res = requests.post(url=url, data=json.dumps(data), headers=headers) # 将字典格式的data变量转换为合法的JSON字符串传给post的data参数
print(res.text)
或
import requests
url = "http://openapi.tuling123.com/openapi/api/v2"
data = {
"reqType":0,
"perception": {
"inputText": {
"text": "附近的酒店"
},
"inputImage": {
"url": "imageUrl"
},
"selfInfo": {
"location": {
"city": "北京",
"province": "北京",
"street": "信息路"
}
}
},
"userInfo": {
"apiKey": "ec961279f453459b9248f0aeb6600bbe",
"userId": "206379"
}
}
res = requests.post(url=url, json=data) # JSON格式的请求,将数据赋给json参数
print(res.text)
JSON类型解析
序列化和反序列化
- 序列化: 内存对象 -> 文本/文件
- 反序列化: 文本 -> 内存对象
对象在HTTP中的传输过程
HTTP协议是超文本传输协议,是通过文本或二进制进行传输的,所以我们发送的请求要转化成文本进行传输,收到的响应也是文本格式,如果是JSON,一般还需要将文本格式重新转化为对象。
JSON对象(Python字典) -> 转为文本请求 -> 发送请求-> 服务器收到文本请求 -> 将文本请求转化为对象,获取其中的参数,处理业务-> 返回文本格式的响应 -> 客户端转为对象格式来从响应中取值。
Python中我们一般提到JSON对象指的是字典
Python的字典的格式和JSON格式,稍有不同: - JSON实际上是字符串
- 字典中的引号支持单引号和双引号,JSON格式只支持双引号
- 字典中的True/False首字母大写,JSON格式为true/false
- 字典中的空值为None, JSON格式为null
JSON格式操作方法
- 序列化(字典 -> 文本/文件句柄): json.dumps()/json.dump()
- 反序列化(文本/文件句柄 -> 字典) : json.loads()/json.load()
import json # 需要导入JSON包
data = {'name': '张三', 'password': '123456', "male": True, "money": None} # 字典格式
str_data = json.dumps(data) # 序列化,转化为合法的JSON文本(方便HTTP传输)
print(str_data)
----------------------输出------------------------
{"name": "\u5f20\u4e09", "password": "123456", "male": true, "money": null}
json.dumps()支持将json文本格式化输出
import requests
import json
res = requests.post("http://www.tuling123.com/openapi/api?key=ec961279f453459b9248f0aeb6600bbe&info=怎么又是你")
print(res.text) # 输出为一行文本
res_dict = res.json() # 将响应转为json对象(字典)等同于`json.loads(res.text)`
print(json.dumps(res_dict, indent=2, sort_keys=True, ensure_ascii=False)) # 重新转为文本
----------------------输出------------------------
{"code":100000,"text":"我才要说怎么又是你"} # res.text,有些接口中文会返回为\u..
{
"code": 100000,
"text": "我才要说怎么又是你" # 树状格式,比较清晰,显示中文
}
json.dumps中的参数:indent: 缩进空格数,indent=0输出为一行;sork_keys=True: 将json结果的key按ascii码排序;ensure_ascii=Fasle: 不确保ascii码,如果返回格式为utf-8包含中文,不转化为\u...。
反序列化
import json
res_text = '{"name": "\u5f20\u4e09", "password": "123456", "male": true, "money": null}' # JSON文本格式的响应信息,注意这里最外层有''
res_dict = json.loads(res_text) # 转化为字典
print(res_dict['name']) # 方便获取其中的参数值
文件的序列号和反序列化
1.序列化:字典 -> 文件句柄
import json
res_dict = {'name': '张三', 'password': '123456', "male": True, "money": None} # 字典格式
f = open("demo1.json","w")
json.dump(res_dict, f)
查看同级目录,增加了一个demo1.json文件,内容为:
{"name": "\u5f20\u4e09", "password": "123456", "male": true, "money": null}
2.反序列化: 文件句柄 -> 字典
在项目中(和下面脚本文件同一路径下)新建demo2.json文件,内容如下,保存
{
"name": "张三",
"password": "123456",
"male": true,
"money": null
}
新建Python文件
import json
f = open("demo2.JSON","r", encoding="utf-8") # 文件中有中文需要指定编码
f_dict = json.load(f) # 反序列化将文件句柄转化为字典
print(f_dict['name']) # 读取其中参数
f.close()
requests库详解
请求方法
request(),get(),options(),head(),post(),put(),patch(),delete(),requests.session(): 用于保持会话(session),除了requests.session()外,其他请求方法的参数都差不多,都包含url,params, data, headers, cookies, files, auth, timeout等等
请求参数
- url: 字符串格式,参数也可以直接写到url中
- params:url参数,字典格式
- data: 请求数据,字典或字符串格式
- headers: 请求头,字典格式
- cookies: 字典格式,可以通过携带cookies绕过登录
- files: 字典格式,用于混合表单(form-data)中上传文件
- auth: Basic Auth授权,数组格式 auth=(user,password)
- timeout: 超时时间(防止请求一直没有响应,最长等待时间),数字格式,单位为秒
响应解析
- res.status_code: 响应的HTTP状态码
- res.reason: 响应的状态码含义
- req.text:响应的文本格式,按req.encoding解码
- req.content: 响应的二进制格式
- req.encoding: 解码格式,可以通过修改req.encoding='utf-8'来解决一部分中文乱码问题
- req.apparent_encoding:真实编码,由chardet库提供的明显编码
- req.json(): (注意,有括号),响应的json对象(字典)格式,慎用!如果响应文本不是合法的json文本,或报错
- req.headers: 响应头
- req.cookies: 响应的cookieJar对象,可以通过req.cookies.get(key)来获取响应cookies中某个key对应的值
import requests
res = requests.get("https://www.baidu.com")
print(res.status_code, res.reason) # 200 OK
print(res.text) # 文本格式,有乱码
print(res.content) # 二进制格式
print(res.encoding) # 查看解码格式 ISO-8859-1
print(res.apparent_encoding) # utf-8
res.encoding='utf-8' # 手动设置解码格式为utf-8
print(res.text) # 乱码问题被解决
print(res.cookies.items()) # cookies中的所有的项 [('BDORZ', '27315')]
print(res.cookies.get("BDORZ")) # 获取cookies中BDORZ所对应的值 27315
带安全认证的请求
需要登录的请求(Cookie/Session认证)
1.使用会话保持
import requests
s = requests.session() # 新建一个会话
s.post(url="https://demo.fastadmin.net/admin/index/login.html",data={"username":"admin","password":"123456"}) # 发送登录请求
res = s.get("https://demo.fastadmin.net/admin/dashboard?ref=addtabs") # 使用同一个会话发送get请求,可以保持登录状态
print(res.text)
2.抓取cookies
import requests
url = "https://demo.fastadmin.net/admin/dashboard?ref=addtabs"
cookies = {"PHPSESSID":"9bf6b19ddb09938cf73d55a094b36726"} # 登录后在Headers的cookie中获得
res = requests.get(url=url, cookies=cookies) # 携带cookies发送请求
print(res.text)
两种方式的对比
- 使用session方式:每次都要发送两次请求,效率较低
- 使用携带cookies方式:需要手动抓包,提取组装,cookies中是session有一定有效期,过期之后要重新抓取和更换cookies
- 如果很多或所有请求都需要登录,可以发一次请求,保持该session为全局变量,其他接口都使用该session发送请求(同样要注意登录过期时间)
appid或token方式
- appid: 系统为合法用户赋予的访问id,固定的字符串,一般经过加密以确保HTTP传输中的安全
- token: 即令牌,固定或需要动态申请(有一定有效期),一般由用户信息及申请时间计算加密而成,用于验证接口访问的权限
token与session的区别 - session是存在服务器的,服务端通过验证客户端的请求所携带的session值在服务会话中是否存在,来验证用户是否合法
- token: 是按一定算法加密计算出来的,服务端通过解密客户端所携带的token值来验证用户是否合法