不用写代码的爬虫系列-入门篇
2018-10-19 本文已影响38人
5a41eb2ceec6
这里以抓取慧航老师的知乎回答为例~
1.打开Web Scraper
鼠标右键-检查
注:这里要确保检查框出现在浏览器底部,如果未在底部点击红框处调整
底部
2.创建sitemap
- sitemap name:自定义
- start url :当前网址
3.设置selector
selector- multiple:抓取多个
- delay:延时(2000-5000)
4.启动抓取程序
注:抓取窗口可以最小化,不关闭;同时可以启动多个程序
5.导出爬取结果
结果展示
csv- web-scraper-order:排序
- web-scraper-start-url:start url
- title-link:链接的文字
- title-link-href:链接对应的真实url
系列未完待续~