第一步梳理_190515

2019-05-15  本文已影响0人  ppzbreeze

初步总结

主要实现方式

几个主要构成

主流工具使用

这里其实有个原则,各种花里胡哨的架构原则上是有用的,不过也要建立在合适的需求之上,如果只是想针对性的获取某些小量数据,完全没必要将很多大的架构研究清楚,作为高级语言,py很大概率能够几行代码就能实现基础功能

裸奔

最简单粗暴的方法,最基础的四个环节

urlopen()        #获取整个页面数据
read()           #将获取的数据保存起来
re.findall()     #匹配正则表达式
urlretrieve()    #将匹配到的数据进行定向爬取

scrapy

慢慢研究中。。。

上一篇 下一篇

猜你喜欢

热点阅读