Python爬虫程序员

Docker上封装scrapy-redis爬虫,架设到云服务器上

2017-06-14  本文已影响267人  开飞机的贝吉塔

需求

具体实施

云服务器环境准备

操作场景:云服务器

安装redis


本地docker镜像安装

操作场景:本地服务器

在爬虫目录下创建Dockerfile

vi Dockerfile

FROM python:2.7-onbuild
RUN pip install -r requirements.txt
ENTRYPOINT ["scrapy"]
CMD ["crawl", "spider1"]

在该目录下创建docker镜像

docker build -t spiderdocker:1 .

docker images查看镜像

docker images

REPOSITORY          TAG                 IMAGE ID            CREATED             SIZE
spiderdocker        1                   00d299391ce        2 hours ago         781MB

镜像保存为1.tar,上传到云服务器上

docker save -o 1.tar
scp 1.tar root@云服务器ip:/docker

爬虫镜像导入并启动

操作场景:云服务器

知识点(坑)

  1. redis配置文件中bind,在云服务器上必须设置为云服务器的内网ip或者0.0.0.0,否则docker中的爬虫无法连接到,至于安全问题,可以通过设置redis用户名密码或者防火墙规则去规避
  2. 已经生成的docker镜像文件不要随便删除,以方便之后修改完代码重新生成镜像时可以从本地直接拉取
上一篇 下一篇

猜你喜欢

热点阅读