Web Scraper 入门教程（第9课）：抓取女神微博相册

2018-02-05 本文已影响139人风巢

下面来讲 Image（图片）选择器。

一、Image（图片）选择器

谁微博没有关注几个男神女神？无聊时候看看靓图的确也能起到打发时间消愁解乏的效果。有时会想是否可以保存下来，无需打开网页也能欣赏。

这就轮到 Image 选择器登场大显身手了，下面开始实操。

1）打开热门微博分类，女明星正好看到赵丽颖，就以她为例好了，头像相册网址：

http://photo.weibo.com/1259110474/albums/detail/album_id/31572553#!/mode/1/page/1

3）建立选择器，设置原则参见第 7 课第二部分设定选项。

4）如以下动图选择图像。

5）抓取并导出Excel如下图

6）我们要的不是图片吗？网址部分整个框选，复制，在迅雷里新建批量下载任务即可。

7）任务完成。

二、课后练习

1、头像相册咱们抓过了，微博配图你会抓不？

2、微博会了，其他网站呢？试试呗。

3、除了 Web Scraper，你还能找到那些 chrome 插件可以抓取微博图片？这里我推荐个，GetAll! 新浪微博照片批量获取工具，玩6了你会感谢我的。

插件ID:egdicppgkfpnjlfgohljcaomjohileoj

如何下载及安装参见第2课第二部分

这节课就到这里，下节课会讲一个元素选择中的小技巧，欢迎关注。

【福利】

1、回复wsdd，获取我翻译的《Web Scraper官方文档》。

2、回复wssm，获得各大常见网站 Sitemap 示例，此列表还会持续更新。

3、我建了个在线文档「爬虫学习材料梳理」，网址：

https://shimo.im/docs/qc5HJYODsNQJcL6k/

4、我组建了一个免费微信群 共同打磨爬虫技能，回复社群了解加入方式，一起切磋，互开脑洞。