Python---如何实现千图成像:初级篇(从图片爬取到图片合成
2018-07-06 本文已影响30人
Wayne_Dream
千图成像:用N张图片拼凑成一张图片。
实现原理:先将所要成像的图片转化成马赛克图片,然后从图库中用对应颜色的图片替换相应色块。
图库中的图片处理:标记图库中每张图片的混合颜色,用于替换目标色块,并记录每张图片的特征用于成像,增加成像质量。
0,起源
英雄联盟-微博德莱文 图片局部
很久前在刷微博的时候看到了这条,被他给震撼到了,图片是由LOL近千张皮肤图片组合构成的(那时还没学Python),就在昨天突然就想起了这个事,就决定也做一个,随即便展开了行动。搜到了这篇文章,看了下图片的构成,决定先取得所有皮肤的图片再说吧!便又开始了爬虫!
- 运行环境:Python3.6.5 , pycharm-2018-1-2 , win10
愣着干嘛,快往下看
1.爬虫思路
- 皮肤图片当然是先在官网找喽,想到了道聚城皮肤专卖区,其中正好有所有我们需要的图片。
皮肤图片来源 - 通过F12锁定图片取得了第一张图片的URL,(https://game.gtimg.cn/images/daoju/app/lol/medium/2-122015-9.jpg)
取得URL -
以此类推便可取得多个皮肤的URL,发现只有图中红框处不同
URLS - 尝试这改变红框内的数字(玄学),在改变后三位(122015-->122001)时,获得了另一张诺手的皮肤,基本可以确定后三位为英雄皮肤编号,前面的数字为英雄编号,且皮肤编号必须为三位,这一步得感谢这位博主,让我更加确定了这个规律的可行性。(这一步花了好久)
- 看到这里你可能会有所疑问,为什么不直接正则获取所需图片的URL呢?为什么要大费周章的寻找规律?因为这个翻页式网站比较特殊,在翻页时URL并不会改变,所以无法通过常用方法获取所有皮肤,那估计又有人要提出使用
selenium
库来模拟人使用浏览器获取所有图片,但是这会造成爬取图片的速度大大下降,只能作为下策(在这过程中了解到了八爪鱼,发现其原理类似于selenium,是模拟人操控浏览器,速度也是不容直视,虽然它能爬取近98%的网站),在博主能力有限的情况下选择了寻找规律之旅!
如果你有好的方法解决这个问题,可以在评论出提出,十分感谢! - 接下来在知道了规律的情况下,就是如何获取每个不同英雄的编号呢?在其他博主的引导下,发现LoL资料库中有所有英雄的头像,通过F12的慢慢查找,发现了这个js文件!
Network
查看其preview,便可得到所有英雄编号,并测试发现可用!比如Ashe艾希的第一个皮肤对应编号按规律应该是22001,所有URL就是https://game.gtimg.cn/images/daoju/app/lol/medium/2-22001-9.jpg,测试发现确实成功了!
- 好了,到此为止网页分析到此结束了,终于可以编写代码了!
2,代码框架
- 1,获取英雄编号及皮肤编号(说明:关于皮肤编号并未找到每个英雄皮肤的数量,所以设置成查找所有001到015的图片,当然也可以更多020也行)
- 2,将编号导入图片URL(https://game.gtimg.cn/images/daoju/app/lol/medium/2-******-9.jpg)中,生成Url_list。
- 3,根据URL来下载对应图片,并保存到本地。
3,完整代码
1 2爬取完成
代码写的比较丑,如有看不懂的部分可在评论区提出,我会秒回你的!/滑稽
好了,到这里我们已经完成了LOL全皮肤的获取,接下来进行最有意思的一步,千图成像!
4,初级阶段我们先使用一款国外的合成软件
Windows用户请选这个打开后界面是这样的。
第一步创建图库
先选第一步
1.1
1.2
等待一会儿
再选第二步create photo mosaic
2.1
2.2
2.3
2.4
2.5,弹出警告点确认
效果图
局部
大吉大利,今晚吃鸡