python 爬虫Scrapy网络爬虫

Scrapy爬取链家网房源 高德地图展示

2017-01-08  本文已影响2018人  happyte

1.代码链接

https://github.com/happyte/buyhouse

2.最终效果图

3.实现思路

import scrapy
class FangjiaItem(scrapy.Item):
    FANGJIA_ADDRESS = scrapy.Field()    # 住房地址
    FANGJIA_NAME = scrapy.Field()       # 名字
    FANGJIA_PRICE = scrapy.Field()      # 房价
    FANGJIA_URL = scrapy.Field()        # 房源url

抓取的代码如下:

name = response.xpath('//div[@class="name-box"]/a/@title').extract()[0]
       url = response.xpath('//div[@class="name-box"]/a/@href').extract()[0]
       price = response.xpath('//p[@class="jiage"]/span[@class="junjia"]/text()').extract()[0]
       address = response.xpath('//p[@class="where"]/span/@title').extract()[0]
item['FANGJIA_NAME'] = name
item['FANGJIA_ADDRESS'] = address
item['FANGJIA_PRICE'] = price
item['FANGJIA_URL'] = 'http://cd.fang.lianjia.com'+url
yield item
ITEM_PIPELINES = {
    'fangjia.pipelines.FangjiaPipeline':300
}

高德地图API调用

采用高德地图对房源进行可视化操作,在工程根目录下创建demo.html文件,页面大框架可直接从示例中心复制:高德 JavaScript API 示例中心http://lbs.amap.com/api/javascript-api/example/map/map-show/。 具体可以看我仓库中的demo.html文件。

上一篇下一篇

猜你喜欢

热点阅读