数据分析啦可爱的爬虫

不用写代码的爬虫系列-入门篇

2018-10-19 本文已影响38人 5a41eb2ceec6

这里以抓取慧航老师的知乎回答为例~

1.打开Web Scraper
鼠标右键-检查

检查
注：这里要确保检查框出现在浏览器底部，如果未在底部点击红框处调整

底部

2.创建sitemap

sitemap

sitemap name：自定义
start url ：当前网址

3.设置selector

selector

multiple：抓取多个
delay：延时（2000-5000）

4.启动抓取程序

scrape1

scrape2

scrape3

注：抓取窗口可以最小化，不关闭；同时可以启动多个程序

5.导出爬取结果

csv

结果展示

csv

web-scraper-order：排序
web-scraper-start-url：start url
title-link：链接的文字
title-link-href：链接对应的真实url

系列未完待续~

上一篇下一篇

猜你喜欢

热点阅读