scrapy

2018-10-17  本文已影响0人  丫丫姑娘_b55e

创建项目
scrapy startproject dbspider
文件说明:

scrapy.cfg:项目的配置信息,主要为Scrapy命令行工具提供一个基础的配置信息。(真正爬虫相关的配置信息在settings.py文件中)

items.py:设置数据存储模板,用于结构化数据,如:Django的Model

pipelines:数据处理行为,如:一般结构化的数据持久化

settings.py:配置文件,如:递归的层数、并发数,延迟下载等

spiders:爬虫目录,如:创建文件,编写爬虫规则。

在spiders文件中创建爬虫的时候,一般以爬取的网站的域名为爬虫的名称
运行项目scrapy crawl qidian

上一篇下一篇

猜你喜欢

热点阅读