python程序员干货

requests源码浅析

2014-08-26  本文已影响4848人  梁杰_numbbbbb

先扯扯淡

很久没写文章了,恐怕大部分人都忘了我了,没办法,人脑虽然有各种缺陷,但是垃圾回收机制却是异常强大。

前段时间一直在忙swift文档的翻译,之后又是各种事,直接导致了公众账号死亡。不得不说,世界变化太快,本想着和我那一千个粉丝一起做安静的美男子,但是天不遂人愿,各种事情接踵而至,最后不得不忍痛放弃了公众号的更新。在此也对粉丝们说句后会无期,虽然你们可能看不到。

Python之父Guido为requests提出过一些有关发展路线的建议。

requests是一个Python的网络请求库,和urllib、httplib之流相比起来最大的优点就是好用,requests官方标榜的就是“我们的库是给人用的哦”。此外,requests还支持https验证并且是线程安全的。

由于工作原因需要使用requests,确实好用,就顺便把代码研究了一番,记录一些关键要点,希望对诸位有所帮助。

一点提醒

本文只会讲解requests的思路和结构,但是不会涉及到语法细节,我认为细节还是大家自己去研究最合适,我这人也懒,能少打几个字就少打几个字吧。

burst link!!

requests中有三巨头(顺便提个小问题,这里有人知道雷霆三巨头吗?没错我说的是萎勃那三个):session,request和cookie。

先说最简单的cookie。

cookie嘛,就是把Python自带的cookielib.CookieJar封装了一下,让它能适应范围更广的输入并且支持一些高端功能(比如检测是否有相同cookie),如果大家想读源码的话,cookie是一个不错的切入点。

接着说session和request。

首先跟我读一遍:session包含request。

session就是会话,一个session下可能有多个请求(因为可能有redirect),提出session的目的是在多个请求之间保存相同的信息。举个例子:如果没有session,那你每次发请求都需要自己构造cookie并传入,但是有了session之后,只要第一次请求传入cookie就可以,相同session中之后的请求都会自动加上这些cookie。

需要注意,发送请求是在session中实现的,也就是说你要“让session发送request”,request本身只是一个物体,它自己不会发送自己。

request有两种形态,第一形态是一个对象,就是我们在代码中常用的那种。但是这种形态是没办法直接发送的,大家都知道,网络请求到最后其实都是一些字符串,所以如果要发送request的话必须启用它的第二形态,这时候它就叫做prepared request,也就是说“我准备好了,我准备好了,我准备好了(海绵宝宝上线)”,此时request内部的一些东西比如header、body就已经转换成字符串,可以发送了。

需要注意,只有第二形态的request可以发送。

下面看代码。

resp = requests.get('http://www.baidu.com')
print resp.content

这是普通青年的用法,可以直观地感受到requests到底多亲切。

s = requests.Session()
s.headers.update({'laozizuidiao': 'laozizuidiao'})
s.get('http://www.gov.cn')
s.get('http://www.beijing.gov.cn')

这是作死青年的用法,前面我们说过,session会保存信息,所以现在我们每次发送请求的时候都会宣布我们是zuidiao的。

s = Session()
req = Request('GET', url,
    data=data,
    headers=header
)
prepped = req.prepare()

# 你这种情况……是要加钱的

resp = s.send(prepped,
    stream=stream,
    verify=verify,
    proxies=proxies,
    cert=cert,
    timeout=timeout
)

print(resp.content)

最后是大家最期待的文艺青年的用法,我们先生成了session和request,然后让request进入第二形态(prepare),这时候万事俱备只差send了,我们可以对request做任何爱做的事,然后最后爽完了send就行了。

我就不信你能看到这

还真看到这了?那我就说说看源码的方法吧。

其实很简单,看源码看的是思想。谁都会写那些isinstanceof、if、init,关键要明白作者的设计思路到底是什么。

比如requests,看完了你应当问问自己,cookie为什么要封装而不是直接用?request为什么要有两个形态?设计session是为了解决什么问题?

只有理解了设计思路,再去看具体的细节实现才能有收获,否则你看到的就是满屏的raise、isinstanceof,这样去看代码恐怕是浪费时间了。

最后祝你,身体健康,谢谢。

上一篇下一篇

猜你喜欢

热点阅读