数据的获取——爬虫

2019-06-15  本文已影响0人  ZzzZBbbB

在数据科学领域阶段,很多人往往将焦点着眼于数据的处理和分析,殊不知数据本身才是最大的价值,无论是看上去再无用的数据,往往都蕴含着量变引起质变的魅力,而如今是“大数据”的时代,互联网每天产生约33ZB(2018年,1ZB=10244GB)的数据,所以:

Data is treasure!

爬虫的概念:

简单的来说,爬虫就是一个模拟人类请求网站行为的脚本。它通过自动请求网页、将数据抓取下来,然后使用一定的规则提取有价值的数据。

爬虫的例子:

爬虫的类别:

上一篇 下一篇

猜你喜欢

热点阅读