大数据,机器学习,人工智能机器学习与数据挖掘大数据 爬虫Python AI Sql

pyspider中给回调函数传参数

2019-11-03  本文已影响0人  叫我老村长

在使用pyspider框架爬去网页的时候, self.crawl(url,callback=fn) 是主要的接口函数。通过这个函数,我们对 url 进行请求,请求完之后继续执行接下来的程序,等 url 响应的时候在调用回调函数 callback 对返回的内容进行处理。
通常在回调函数中我们会对新的 url 发情求,此时就需要另外一个回调函数。如果我们希望将将一次请求响应的内容传到下一个回调函数使用时,就需要使用 self.crawl() 的 save 参数。然后在回调函数中通过response.save[] 来获取传进来的数据。官网的介绍如下:

def on_start(self):
    self.crawl('http://www.example.org/',
    callback=self.callback, save={'a': 123})

def callback(self, response):
    return response.save['a']
上一篇 下一篇

猜你喜欢

热点阅读