python实战篇:利用request库打造自己的翻译接口
通过阅读之前python基础篇的文章,基本上对python这门语言有了初步的了解。基础篇的文章都是介绍python的一些语法和函数的使用方法。实战篇是通过一个完整的案例讲解python在实际开发中运用方法。今天通过做一个翻译的接口来介绍一下
request
库的基本用法。
request库的基本使用
安装
要使用Python中的requests库,首先需要使用pip安装它。您可以在终端中运行以下命令来完成此操作:
pip install requests
使用
安装库后,您可以使用它来进行HTTP请求。以下是如何进行GET请求的示例:
import requests
response = requests.get('https://www.baidu.com')
print(response.text)
在此示例中,我们导入requests库,然后使用get方法进行GET请求到https://www.baidu.com。服务器的响应存储在response变量中,我们将响应文本打印到控制台。
还可以将参数传递给get方法,以在请求中包含查询参数:
import requests
params = {'key1': 'value1', 'key2': 'value2'}
response = requests.get('https://www.example.com', params=params)
print(response.url)
在此示例中,我们将查询参数的字典传递给get方法的params参数。生成的URL将包括查询参数,我们将URL打印到控制台。
还可以使用post方法进行POST请求:
import requests
data = {'key1': 'value1', 'key2': 'value2'}
response = requests.post('https://www.example.com', data=data)
print(response.text)
在此示例中,我们将数据的字典传递给post方法的data参数。数据将在请求的正文中发送,我们将响应文本打印到控制台。
开发自己的翻译接口
分析百度翻译
打开百度翻译地址,然后按F12
打开开发者模式,输入翻译的内容,点击翻译,通过下图,可以清楚看到请求的地址和请求的参数
百度翻译通过向https://fanyi.baidu.com/v2transapi发送post请求,发送的数据中只有sign是不断变化的,搜索v2transapi发现sign字段是通过js通过你要发送的数据字符串进行加密得到的。
通过百度翻译的js
分析得出加密的关键代码如下:
现在已经搞清楚了整个调用的流程,所有的参数都可以自己构造。这样就可以写代码了。
写接口代码
1、为了防止请求失败,需要模仿浏览器请求,在请求时加上请求头,我们采用fake_useragent
这个第三方库,随机生成不同的User-Agent
。关键代码如下:
from fake_useragent import UserAgent
headers = {'User-Agent': UserAgent().random}
2、生成sign
参数,由于加密的js
代码我们看不明白,直接调用python
的第三方库执行js
代码,使用前需要安装execjs
库,执行如下的代码:
pip3 install PyExecJS
这个库使用方法也很简单,例如,上面我们已经把百度的加密js
代码已经提取出来了,并新建一个js
文件,把内容复制进去。关键代码如下:
def generate_sign(self,query):
try:
if os.path.isfile("./baidu.js"):
with open("./baidu.js", 'r', encoding="utf-8") as f:
baidu_js = f.read()
ctx = execjs.compile(baidu_js)
return ctx.call('b', query)
except Exception as e:
print(e)
先把js文件读到缓存中,再通过
execjs
调用该对象。最后通过调用call
方法执行js
文件的里面的方法,其中b
是对应js
的方法,query
是js
中b
方法的参数。
调用成功后,返回如下:
3、获取token
值,通过观察百度翻译页面的源码,发现token
是存放在页面中的,这样我们就可以通过请求页面获取到token
.
res = request.get("https://fanyi.baidu.com").content.decode()
token = re.findall(r"token: '(.*)',", res, re.M)[0]
4、到目前为止所有的请求参数已经有了,这样我们就可以开始构造请求。核心代码如下:
url = 'https://fanyi.baidu.com/v2transapi'
sign = generate_sign("你好")
data = {
"from": "zh",
"to": 'en',
"query": "你好",
"transtype": "translang",
"simple_means_flag": "3",
"sign": sign,
"token": self.token,
"domain": "common"
}
res = requests.post(
url=url,
params={"from": "zh", "to": 'en'},
data=data,
headers = {
'User-Agent': UserAgent().random,
}
)
res.json().get("trans_result").get("data")[0].get("dst")
请求成功后,会返回如下图:
通过实际的调用中发现不是每次请求成功的,所以需要多次进行请求,通过一个循环操作,当清楚成功就跳出循环,关键代码如下:
tryTimes = 0
try:
while tryTimes < 100:
res = self.session.post(
url=url,
params={"from": fromLan, "to": toLan},
data=data,
)
if "trans_result" in res.text:
break
tryTimes += 1
return res.json().get("trans_result").get("data")[0].get("dst")
这样我们就已经完成利用百度翻译接口,做成自己的翻译接口调用了。可以根据自己的需求采用Flask
或Fastapi
开发API接口了。下面是全部的代码
本文由mdnice多平台发布