不用写代码的爬虫系列-简介篇
2018-10-19 本文已影响10人
5a41eb2ceec6
在开始之前,先了解下常用的数据爬取工具有哪些~
一、常见数据爬取工具
![](https://img.haomeiwen.com/i11013023/5f5b810a969aa636.png)
图片来源:https://www.zhihu.com/people/chen-da-xin-84/answers
- 八爪鱼、火车头(LocoySpider)采集方便、能适应情况也很多,但是生存能力较差(易被反爬虫机制识别)
- Excel也可以抓取网页,但是生存能力差
- Python,爬虫利器,但是对于一般人来说需要投入的时间精力成本大
二、Web Scraper可以做些什么?
![](https://img.haomeiwen.com/i11013023/cbaa7b33e53de5b7.png)
Web Scraper支持动态加载数据类型,如:
- 可以等待页面里数据加载完再开工
- 可以自动点击分页按钮(第1页,第2页...)加载更多数据
- 可以自动点击加载更多按钮,加载更多数据
- 可以自动滚动/下拉页面加载更多数据
- 分页
栗子:中国房地产信息网-招拍挂公告
![](https://img.haomeiwen.com/i11013023/cfec7d040b4bc30e.png)
2.加载更多
栗子:虎嗅网
![](https://img.haomeiwen.com/i11013023/e7604f7ea28861ab.png)
3.滚动/下拉
没找到实际页面╭(╯^╰)╮