利用Python对链家网北京二手房进行简单数据分析

2019-01-12  本文已影响0人  嗨学编程

本文主要讲述如何通过pandas对爬虫下来的链家数据进行相应的二手房数据分析,主要分析内容包括各个区,各个小区的房源信息情况

推荐下我自己创建的Python学习交流群960410445,这是Python学习交流的地方,不管你是小白还是大牛,小编都欢迎,不定期分享干货,包括我整理的一份适合零基础学习Python的资料和入门教程。

然后查看是否有数据

#获取总价格全五的数据

house.sort_values('totalprice',ascending=False).head(5)

字符串的处理

接下来我来计算所有户型的个数,然后用图像展示出来

#计算户型的所占的个数,用到value_counts(),排序也给你做好了,你可以清楚的看到所占的个数

housetype = house['housetype'].value_counts()

结果

有于matplotlib不显示中文我在网上查了些资料,得到的解决方案就是加两行代码

图像展示结果,有图像可以清楚的看到数量分布情况

结果

图像展示

户型与看房次数

在售面积分布

#如有错误请指出,谢谢!

上一篇下一篇

猜你喜欢

热点阅读