Web Scraper 入门教程(第9课):抓取女神微博相册
2018-02-05 本文已影响139人
风巢
下面来讲 Image(图片)选择器。
一、Image(图片)选择器
谁微博没有关注几个男神女神?无聊时候看看靓图的确也能起到打发时间消愁解乏的效果。有时会想是否可以保存下来,无需打开网页也能欣赏。
这就轮到 Image 选择器 登场大显身手了,下面开始实操。
1)打开热门微博分类,女明星正好看到赵丽颖,就以她为例好了,头像相册网址:
http://photo.weibo.com/1259110474/albums/detail/album_id/31572553#!/mode/1/page/1
2)建立 Sitemap。
3)建立选择器,设置原则参见第 7 课第二部分设定选项。
4)如以下动图选择图像。
5)抓取并导出Excel如下图
6)我们要的不是图片吗?网址部分整个框选,复制,在迅雷里新建批量下载任务即可。
7)任务完成。
二、课后练习
1、头像相册咱们抓过了,微博配图你会抓不?
2、微博会了,其他网站呢?试试呗。
3、除了 Web Scraper,你还能找到那些 chrome 插件可以抓取微博图片?这里我推荐个,GetAll! 新浪微博照片批量获取工具,玩6了你会感谢我的。
插件ID:egdicppgkfpnjlfgohljcaomjohileoj
如何下载及安装参见第2课第二部分
这节课就到这里,下节课会讲一个元素选择中的小技巧,欢迎关注。
【福利】
1、回复wsdd,获取我翻译的《Web Scraper官方文档》。
2、回复wssm,获得 各大常见网站 Sitemap 示例,此列表还会持续更新。
3、我建了个在线文档 「爬虫学习材料梳理」,网址:
https://shimo.im/docs/qc5HJYODsNQJcL6k/
4、我组建了一个免费微信群 共同打磨爬虫技能,回复社群了解加入方式,一起切磋,互开脑洞。