Spbeen——Python技术栈生活不易 我用python

Scrapy简单笔记(三)

2017-03-21  本文已影响51人  布拉豆

Scrapy功能介绍

示例的scrapy项目非常的简单,熟练爬虫的程序员可以一个脚本搞定以上全部内容,但scrapy并不是一个简单的打开、分析、下载操作集合

1、下载项目图片

Scrapy提供了一个 item pipeline ,来下载属于某个特定项目的图片,比如,当你抓取产品时,也想把它们的图片下载到本地。

这条管道,被称作图片管道,在 ImagesPipeline 类中实现,提供了一个方便并具有额外特性的方法,来下载并本地存储图片:

2、自动限速扩展

该扩展能根据Scrapy服务器及您爬取的网站的负载自动限制爬取速度。

设计目标

3、Jobs:暂停,恢复爬虫

有些情况下,例如爬取大的站点,我们希望能暂停爬取,之后再恢复运行。

Scrapy通过如下工具支持这个功能:

有问题可以进群QQ:569340548

参与问卷调查,有机会送书哟~

链接:https://sojump.com/jq/12779681.aspx

调查问卷二维码:

二维码

Scrapy课程链接:http://study.163.com/course/courseMain.htm?courseId=1003666043

Python教程、教程--传送门

上一篇 下一篇

猜你喜欢

热点阅读