python学习笔记

【实战】 python爬取链家北京在售二手房数据(一)

2020-02-20  本文已影响0人  Hobbit的理查德

1.背景

上次通过stata爬取了教育部的政策文件数据,大概了解了爬取数据思路以及正则表达式方面的知识。

但是,用stata在清洗时确实比较费力。

这不,前段时间安装了stata 16,新功能(官方介绍New in Stata 16)中有个比较亮眼的功能,

就是可以在stata中写python语句,调用python的包进行数据处理,

这就给了很大动力去学习python爬虫,

这样的话,就可以实现python爬取数据,再用stata进行处理分析,用stata和python结合出报告啦~

想想都激动呢~

因此,以链家北京在售二手房数据为例,花了2天时间学习并爬取了共84278条数据~

2.学习过程

4. 结果

每个区所有链接.png

预告:
【实战】 python爬取链家北京在售二手房数据(二)

上一篇下一篇

猜你喜欢

热点阅读