Python

Scrapy 教程

2017-05-27  本文已影响16人  踏云小子
pip install -i https://pypi.douban.com/simple virtualenv 
scrapy startproject yourProject
scrapy genspider 爬虫名称 example.com(爬虫网址)
image.png image.png
from scrapy.cmdline import execute

import sys
import os

sys.path.append(os.path.dirname(os.path.abspath(__file__))) #加入该模块
execute(["scrapy", "crawl", "jobbole"]) #相当于命令行 scrapy crawl jobbole(之前设置的爬虫名称)

这样就可以用断点进行调试了

ROBOTSTXT_OBEY = False
上一篇 下一篇

猜你喜欢

热点阅读