数据简报&产品生活0岁的产品经理产品大学

从腾讯“偷”到的3000万数据,究竟要怎么看?

2015-07-28  本文已影响2480人  李思柰

今天看到了一篇文章:
《我从腾讯那“偷了”3000万QQ用户数据,出了份很有趣的独家报告!》**
原作者写了一个爬虫,以自己为源头抓取好友的QQ,并根据抓取到的QQ数据,总结出了一份报告。
但是仔细阅读后,感觉这份报告趣味有余但是分析不足,还只是停留在看图说话的阶段,原作者还需要一个产品经理!
此言一出,就被朋友甩来一句:“you can you up”。
好吧,鉴于我没有亲自写爬虫抓数据,那么就用原文里的统计图,试试看图说话吧,帮助原作者发现更多内容。
1.活跃时间分布?

如果不看原文的话,看到这里,我大胆推测原作者的年龄大概在25岁左右,好友里面学生和已经工作人都有一些,且学生较多,在北京上海的工作人群也不会是样本的主流。因为从22点到23点的情况来看,似乎活跃度受到了某种外力的影响而急剧下降,我猜是学校里的熄灯制度造成的。从8点和17点之间的情况看,应该是标准的工作时间。如果在京沪早八点上班的话,一定会被拥堵的交通折磨直至迟到的。

2.生日分布?

这幅图,作者使用的数据是QQ用户的生日资料。原文里,这个部分是一个十分巨大的槽点

10月份生小孩的多好理解,一年忙差不多了,天气也不冷不热正是生小孩的好时候。 但1月份最高且和2月落差很大有点不好理解,那么冷的天生不怕冻吗? 我估计是1月份也快过年了,以前没聚一起的好不容易聚一起了,就容易冲动,冲动就啪啪啪。 4月份生日的最少也好理解,中国人不喜欢4这个数字呗。

还是看看我的分析吧:

看到这里,我大胆推测原作者是南方人,因为4月出生的人实在是少的比较明显,说明夏天一定很热,如果再激进一点,大概可以把范围缩小到那几个著名的“火炉”所在的华中地区吧。

3.用户所在地分布

这部分我没有找到太多能推测的信息。不过还是可以补充一些:

4.年龄分布

这部分也没有太多好说的了,年龄跨度其实不太大。不过还是有几点可以谈:

5.性别分布

性别统计方面,没填的部分可以按照已知的男女比例进行分配。

原文还有一些语义和舆情的分析,在下短期内难以发现亮点,就不再继续了。

写在最后

以上
本文源地址:墨刀 - 免费的移动应用原型与线框图工具**

上一篇 下一篇

猜你喜欢

热点阅读