Python---如何实现千图成像：初级篇（从图片爬取到图片合成

2018-07-06 本文已影响30人 Wayne_Dream

千图成像：用N张图片拼凑成一张图片。
实现原理：先将所要成像的图片转化成马赛克图片，然后从图库中用对应颜色的图片替换相应色块。
图库中的图片处理：标记图库中每张图片的混合颜色，用于替换目标色块，并记录每张图片的特征用于成像，增加成像质量。

0，起源

英雄联盟-微博

德莱文

图片局部

很久前在刷微博的时候看到了这条，被他给震撼到了，图片是由LOL近千张皮肤图片组合构成的（那时还没学Python），就在昨天突然就想起了这个事，就决定也做一个，随即便展开了行动。搜到了这篇文章，看了下图片的构成，决定先取得所有皮肤的图片再说吧！便又开始了爬虫！

运行环境：Python3.6.5 ， pycharm-2018-1-2 ， win10

愣着干嘛，快往下看

1.爬虫思路

皮肤图片当然是先在官网找喽，想到了道聚城皮肤专卖区，其中正好有所有我们需要的图片。
皮肤图片来源
通过F12锁定图片取得了第一张图片的URL，（https://game.gtimg.cn/images/daoju/app/lol/medium/2-122015-9.jpg）
取得URL
以此类推便可取得多个皮肤的URL，发现只有图中红框处不同

URLS
尝试这改变红框内的数字（玄学），在改变后三位（122015-->122001）时，获得了另一张诺手的皮肤，基本可以确定后三位为英雄皮肤编号，前面的数字为英雄编号，且皮肤编号必须为三位，这一步得感谢这位博主，让我更加确定了这个规律的可行性。（这一步花了好久）
看到这里你可能会有所疑问，为什么不直接正则获取所需图片的URL呢？为什么要大费周章的寻找规律？因为这个翻页式网站比较特殊，在翻页时URL并不会改变，所以无法通过常用方法获取所有皮肤，那估计又有人要提出使用selenium库来模拟人使用浏览器获取所有图片，但是这会造成爬取图片的速度大大下降，只能作为下策（在这过程中了解到了八爪鱼，发现其原理类似于selenium，是模拟人操控浏览器，速度也是不容直视，虽然它能爬取近98%的网站），在博主能力有限的情况下选择了寻找规律之旅！
如果你有好的方法解决这个问题，可以在评论出提出，十分感谢！
接下来在知道了规律的情况下，就是如何获取每个不同英雄的编号呢？在其他博主的引导下，发现LoL资料库中有所有英雄的头像，通过F12的慢慢查找，发现了这个js文件！
Network

查看其preview，便可得到所有英雄编号，并测试发现可用！比如Ashe艾希的第一个皮肤对应编号按规律应该是22001，所有URL就是https://game.gtimg.cn/images/daoju/app/lol/medium/2-22001-9.jpg，测试发现确实成功了！

preview

好了，到此为止网页分析到此结束了，终于可以编写代码了！

2，代码框架

1，获取英雄编号及皮肤编号（说明：关于皮肤编号并未找到每个英雄皮肤的数量，所以设置成查找所有001到015的图片，当然也可以更多020也行）
2，将编号导入图片URL（https://game.gtimg.cn/images/daoju/app/lol/medium/2-******-9.jpg）中，生成Url_list。
3，根据URL来下载对应图片，并保存到本地。