爬虫专题网络爬虫大数据 爬虫Python AI Sql

Web Scraper 入门教程(第9课):抓取女神微博相册

2018-02-05  本文已影响139人  风巢

下面来讲 Image(图片)选择器。

一、Image(图片)选择器

谁微博没有关注几个男神女神?无聊时候看看靓图的确也能起到打发时间消愁解乏的效果。有时会想是否可以保存下来,无需打开网页也能欣赏。

这就轮到 Image 选择器 登场大显身手了,下面开始实操。

1)打开热门微博分类,女明星正好看到赵丽颖,就以她为例好了,头像相册网址:

http://photo.weibo.com/1259110474/albums/detail/album_id/31572553#!/mode/1/page/1

2)建立 Sitemap

3)建立选择器,设置原则参见第 7 课第二部分设定选项

4)如以下动图选择图像。

5)抓取并导出Excel如下图

6)我们要的不是图片吗?网址部分整个框选,复制,在迅雷里新建批量下载任务即可。

7)任务完成。

二、课后练习

1、头像相册咱们抓过了,微博配图你会抓不?

2、微博会了,其他网站呢?试试呗。

3、除了 Web Scraper,你还能找到那些 chrome 插件可以抓取微博图片?这里我推荐个,GetAll! 新浪微博照片批量获取工具,玩6了你会感谢我的。

插件ID:egdicppgkfpnjlfgohljcaomjohileoj

如何下载及安装参见第2课第二部分

这节课就到这里,下节课会讲一个元素选择中的小技巧,欢迎关注。

【福利】

1、回复wsdd,获取我翻译的《Web Scraper官方文档》。

2、回复wssm,获得 各大常见网站 Sitemap 示例,此列表还会持续更新

3、我建了个在线文档 「爬虫学习材料梳理」,网址:

https://shimo.im/docs/qc5HJYODsNQJcL6k/ 

4、我组建了一个免费微信群 共同打磨爬虫技能,回复社群了解加入方式,一起切磋,互开脑洞。

上一篇 下一篇

猜你喜欢

热点阅读