网络爬虫

2016-08-30  本文已影响0人  OwlofDark

项目简介

网络爬虫的方式来获取信息目前在工业领域是一个高效率从网络上获取信息的方式,作为一个项目的介绍,在这个项目中,我们使用Scrapy(一个用Python写的开源框架)。这个框架最初被设计用来做网络爬取,后来也可以被用来提取数据使用的APIs或者是一般意义上的网络爬虫。尽管Scrapy对网络爬虫来说是一个非常详细的基础应用架构,但是在实际的编程过程中仍然会遇到许多实际的困难。eg:工程JavaScript和IP被锁死。

项目描述

目标

工具需求

基础知识

提交项目

参考网站

[1] https://www.bittiger.io/microproject/oYDSG6MSFihpiNJ66
[2] http://scrapy.org
[3]https://www.mongodb.org/
[4]https://github.com/scrapinghub/scrapy-splash
[5]https://blog.scrapinghub.com/2015/03/02/handling-javascript-in-scrapy-with-splash/

上一篇下一篇

猜你喜欢

热点阅读