大家眼里的孙杨是清白还是活该?这些数据可视化,或许能找到答案
大概在10个月前,孙杨,这位获奖无数的游泳运动员,被禁赛8年。
孙杨本人对于该次判决的回应
当时我说,他是清白的,很多人抱有怀疑态度,我只感到寒心:一个为国争光的运动员,竟然会有这么多人对他进行谩骂和攻击。
今天,8年禁赛令被推翻了。
当时喷他的那些人,现在在哪里?会不会为当时的言论感到抱歉?
我们不应该去评判这结果是对还是错,是公平还是不公平,就像8个月前那样,这没意义,吵来吵去也没有一个准确的结果。
拿走你的键盘之后,如果每个人都能理性地评判别人,那会是一件多美好的事情。
今天不说别的,我是做大数据的,就用大数据来分析一下孙杨的历史成就,以及别人是怎么看他的。
第一步就是网上找数据了,我用到了python爬取,当然,爬的都是该爬的,不该爬的我不会动的,具体有哪些数据可以看一下后面的分析部分。
本来,我是打算用Excel的,后来发现Excel的作用除了保存数据也没什么了,获取的数据量比较大,Excel支撑不了分析,自然也就被我忽略了,平时工作里简单的分析可以搞定,但是一旦涉及大数据,就不大行了。
这缺点也不是一两天了,数据量大的时候,Excel的加载、查询、计算、反应速度会下降的,处理多种数据的能力也不行,总不至于让我拿Excel做数据清洗吧。
于是,就需要使用专业的数据分析工具,如商业智能,也就是BI。
说白了,就是来取代Excel的,当然有个特定条件,在企业级的数据量下。
企业现在对于BI还是很青睐,今天才看了一个研究报告,企业对于BI这一块的投入会越来越大。
BI领域的工具,一般都是头部的,国外Tableau,国内FineBI,我更青睐后者,因为更简单,有帮助文档,等你遇到问题的时候,就知道这有多重要了。
什么是FineBI?
我所知道的,大部分人或者企业做报表的方法如下:
1、程序员用代码写,业务去找IT沟通需求,然后遇到不满意的再改
2、业务人员用Excel处理,可能需要天天加班,还得担心Excel卡死
那为什么不改变呢?
可视化也不含糊,可以说是优点之一,也是比Excel强的地方。
拖拖拽拽即可生成可视化
广州地区二手房分析
我以前的文章也说过很多,可以去看看。
关于孙杨的数据分析
1、成绩可视化
这成绩能看出来一点东西吧,总得来说,整体数据是非常不错的。
我们不考虑外界评价,不考虑别人的误解,就这成绩,是不是在该领域做到了比较好呢?扪心自问,你在自己的工作岗位上做到这样了吗?
2、网友对他的评价
我看着热度在不断升高,也看见了孙杨微博的粉丝数,从几十万上升到几百万。
当时事情刚刚出来的时候,连续占据了好几天的榜首,现在澄清的东西来了,反而没什么人关注了。
还好当时的数据可以获取到,用python,获取了网上对于孙杨事件的评论,话题的热度很高,有上亿,讨论的人数也很多,3400多万。
我通过FineBI,做出了可视化分析:
这个图表叫词云图,越在中间,图表越大,就表示这个词的出现评论越高。
现在知道结果了,你看完什么感觉?
知乎当时可是好多人出来反对的,现在怎么没声了?是不是这10个月过的不太如意?
我个人是觉得,在一件事情的结果出来之前,谨慎去评论,搞不好就会说错而显得自己无知。
伴随着谩骂声的,应该还有赞美与骄傲。
其实这个分析也挺简单,有了数据和FineBI工具,你也可以去操作一下。