0304
2018-04-13 本文已影响0人
李慕玄
03章 开始采集
3.4 用Scrapy采集
先创建Scrapy项目,如果在当前目下:
scrapy startproject wikispider
wikiSpider是新项目的名称,在当前目录中会新建一个名称也是wikiSpider 的项目文件夹。
为了创建爬虫,要在wikiSpider/wikiSpider/spiders/ 文件夹里增加一个
articleSpider.py文件。另外,在items.py文件中,要定义一个Article 类。