EDA数据可视化展示维基百科词条

2018-07-15  本文已影响0人  Mddull

对数据间不同变量进行EDA展示,看出不同变量间的关系,和哪些数据可能异常。

导入需要的包和数据。

定义函数,通过正则表达式,获取不同国家分类。

引入统计函数。按国家对数据分类。

绘制不同国家的曲线图。

EDA展示成功,可以发现因为某些原因,中文的维基词条使用次数很低。

而俄语有异常,当时可能有一些现象级的热门事件的发生。

英语是使用次数最多的。

上一篇 下一篇

猜你喜欢

热点阅读