Scrapy框架步骤

2018-12-03 本文已影响0人老夫愿闻其翔

简单了解一下Scrapy框架于操作步骤

    scrapy startproject myspider

新建爬虫文件

scrapy genspider zzw china.com

这是创建成功后在pycharm中的显示

新建爬虫文件

这个代码是你创建好文件以后里面就有
3.代码思路
1)请求导航条上的每个按钮对应的页面
2)分别解析每个页面的列表(主要获得网页的详情url)
3)请求详情url,解析网页的详细信息(周排名，反链接数，简介，网站排名，得分，网站图片地址)
4)根据下载地址下载到本地

将需要存储的信息写入,如图所示:

第五步——配置pipelines/与储存有关

第六步——在Terminal中输入运行命令

   scrapy+crawl+爬虫名称