爬虫脚本篇-车享家服务门店信息爬取(原创)
2019-02-27 本文已影响0人
WoodyWu
一、目标网站选取和分析
1、目标网站地址选择
车享家:http://jia.chexiang.com/t/stores.
2、目标网站分析
a、获取全部城市的编码和名称(具体如图操作)
首次刷新网址,加载的请求列表就可以看到获取城市的post请求地址:
请求地址:http://jia.chexiang.com/city/getAllCityList.htm
请求方法:POST
传参:无
![](https://img.haomeiwen.com/i12557452/07dbb4c44406461b.png)
![](https://img.haomeiwen.com/i12557452/64c33a506a723bfa.png)
b、获取门店信息(具体如下)
城市编码、城市名称、门店名称、门店地址、电话、手机、经度和维度信息
![](https://img.haomeiwen.com/i12557452/4ac2085085133df9.png)
![](https://img.haomeiwen.com/i12557452/ae526c6563f801e2.png)
输出结果如图所示,也是json格式,和城市类似处理形式
![](https://img.haomeiwen.com/i12557452/388afc602dcc3a0c.png)
3、目标网站爬取
爬取具体内容见代码
获取城市信息
![](https://img.haomeiwen.com/i12557452/1dc663fe9c6884f1.png)
获取门店信息
![](https://img.haomeiwen.com/i12557452/ffa8a30eb599614e.png)
保存到记事本文件中
![](https://img.haomeiwen.com/i12557452/aee039bcef6e4321.png)
主方法
![](https://img.haomeiwen.com/i12557452/95c10475a41d2dbe.png)
运行结果:
![](https://img.haomeiwen.com/i12557452/02130fd67c8389eb.png)
4、总结
本次主要针对之前web scraper不支持的一个简单总结,此篇内容适合爬取汽车主机厂官网经销商和服务商信息