程序员

网络爬虫

2019-01-19  本文已影响0人  阿提艾斯

自动抓取互联网信息的程序;利用互联网数据进行分析、开发产品。
步骤:
1、通过网络链接获取网页内容(其实就是字符串)
2、对获得的网页内容进行处理

requests模块

网络链接的模块
1、requests模块是一个简洁且简单的处理HTTP请求的工具。
2、支持非常丰富的链接访问功能,包括URL获取,HTTP会话,Cookie记录等。
3、requests网页请求

函数 含义
get() 对应HTTP的GET方式
post() 对应HTTP的POST方式,用于传递用户数据

4、request对象属性

函数 含义
status_code HTTP请求的返回状态,200表示连接成功,400表示失败
text HTTP相应内容的字符串形式,即url对应的页面内容

更多方法参考:http://docs.python-requests.org/

上一篇下一篇

猜你喜欢

热点阅读