Python库之网络爬虫

2018-05-16  本文已影响13人  闫_锋

Requests: 最友好的网络爬虫功能库
-提供了简单易用的类HTTP协议网络爬虫功能
-支持连接池,SSL, Cookies, HTTP(S)代理等
-最主要页面级爬虫工具

Scrapy
-提供了构建网络爬虫系统的框架功能,功能半成品
-支持批量和定时网页爬取,提供数据处理流程等
-Python最主要且专业的网络爬虫框架

PySpider
-强大的Web页面爬取系统
-支持数据库后端,消息队列,优先级,分布架构等
-Python重要的网络爬虫类第三方库

上一篇 下一篇

猜你喜欢

热点阅读