利用Python对链家网北京二手房进行简单数据分析
2019-01-12 本文已影响0人
嗨学编程
本文主要讲述如何通过pandas对爬虫下来的链家数据进行相应的二手房数据分析,主要分析内容包括各个区,各个小区的房源信息情况
推荐下我自己创建的Python学习交流群960410445,这是Python学习交流的地方,不管你是小白还是大牛,小编都欢迎,不定期分享干货,包括我整理的一份适合零基础学习Python的资料和入门教程。
然后查看是否有数据
#获取总价格全五的数据
house.sort_values('totalprice',ascending=False).head(5)
字符串的处理
接下来我来计算所有户型的个数,然后用图像展示出来
#计算户型的所占的个数,用到value_counts(),排序也给你做好了,你可以清楚的看到所占的个数
housetype = house['housetype'].value_counts()
结果
有于matplotlib不显示中文我在网上查了些资料,得到的解决方案就是加两行代码
图像展示结果,有图像可以清楚的看到数量分布情况
结果
图像展示
户型与看房次数
在售面积分布
#如有错误请指出,谢谢!