Python爬虫进阶:搭建属于自己的美少女图片站

2019-09-24  本文已影响0人  不学无术丶

关注我的你应该已经学会了:爬取妹子图整站数据(教程已下架)

于是有人不禁会问:拿几十G的图片有什么用呢?

有什么用呢?我也自问。于是下面这个网站就诞生了......

小姐姐 ( 施工重地,闲人免入!女生请绕道~)

如果你想通过爬虫自动采集数据(比如:mm131、mmjpg、妹子图等各大美女图片站),并与前端网页对接,将采集到的数据自动呈现到网页上,从而搭建一个属于自己的图片站。那么,以下内容就是为你准备的!按着步骤来一定可以实现你想要的,当你对这个项目有了自己的认知后,就可以考虑二次开发精进创作~

(以下操作默认你已经拥有域名、服务器,安装了宝塔面板以及能通过Xshell连接,我也写了一篇小白教程帮你解决这些问题)

准备好就开始吧!

解析域名

(以我在用的GoDaddy域名为例)

创建站点

DATABASES = {
    'default': {
        'ENGINE': 'django.db.backends.mysql',
        'NAME': '数据库名',
        'USER': '数据库用户名',
        'PASSWORD': '数据库密码',
        'HOST': '127.0.0.1',
        'PORT': '3306',
    }
}

启动项目

反向代理

到这一步,项目网站就搭建好了,但此时网站还没有数据,需要运行爬虫程序爬取。爬虫程序位于crawler目录下,每一个文件都是独立的,可单独执行。第一次运行时,可修改爬虫参数采集全站,之后修改参数为采集第一页,配合定时任务,实现自动采集和发布

自动采集和发布

(以crawler_mm131.py爬虫程序为例)

dbhost = {
    "host": "127.0.0.1",
    "dbname": "数据库名",
    "user": "数据库用户名",
    "password": "数据库密码"
}

进阶技巧

1.网站采集数据后,如果点击图集无法跳转,则需要在数据库中手动添加图片分类

2.发布本地图片

3.图片压缩

4.删除图集

5.下载采集未完成的图片

项目源码

https://pan.baidu.com/s/1Gj7UJ0XWuh2bI9IIZnv4ZA 提取码:72oo

上一篇 下一篇

猜你喜欢

热点阅读