07 pyspider

2019-08-05  本文已影响0人  yungege

01 pyspider

一、什么是Pyspider框架

python 脚本控制,可以用任何你喜欢的html解析包(内置 pyquery)

WEB 界面编写调试脚本,起停脚本,监控执行状态,查看活动历史,获取结果产出

数据存储支持MySQL, MongoDB, Redis, SQLite, Elasticsearch; PostgreSQL 及 SQLAlchemy

队列服务支持RabbitMQ, Beanstalk, Redis 和 Kombu

支持抓取 JavaScript 的页面

组件可替换,支持单机/分布式部署,支持 Docker 部署

强大的调度控制,支持超时重爬及优先级设置

支持python2&3

二、简单实用

1、启动pyspider

命令行输入

pyspider

2、打开127.0.0.1:5000页面

3、create按钮创建项目

在web控制台点create按钮新建任务,项目名自定义。本例项目名为v2ex。

4、代码编写

保存后打开代码编辑器(代码编辑器默认有简单的实例代码)

右侧就是代码编辑器,以后可以直接在这添加修改代码。代码如下:

代码简单分析:

更多知识:

5、执行任务

上一篇 下一篇

猜你喜欢

热点阅读