Scrapy--爬取链家网二手房信息

2019-05-17  本文已影响0人  詠_遠

最近在学习scrapy框架,尝试写了几个简单的项目试试水,下面分享一个简单的链家网二手房信息爬取

一、项目所需环境

版本-python3

工具-xpath

环境-centos(scrapy环境)

编辑器-pycharm

二、目标网站

通过F12分析网页信息,使用xpath提取关键信息,逐项分析提取

由于链家网进行了分页,所以需要分析下页的入口url,经过分析链家的分页链接有规律可循,

图片所示对应第二页,既然有规律可循,那么进行分页跳转就变得相当简单了

这样就能顺利爬取到链家网所有的二手房信息

主要代码如下:

上一篇 下一篇

猜你喜欢

热点阅读