分析一份数据报告的分析过程(1)
2019-03-06 本文已影响0人
鼻子两个孔
链接:https://mp.weixin.qq.com/s/a0KKw8JZpOx802QL-FMoOw
来源:公众号——零点星事
标题:多维度数据看火箭少女和Nine Percent,新兴流量还是圈地自嗨吗?
内容:通过多重数据维度分析2018年两大偶像团队是否红进了非追星群体中
分析方法总结
- 开篇介绍背景需要简洁明了,有吸引力;
- 单个维度的数据,可能需要从不同的平台获得,最后要根据影响力通过加权得到最终结果;
- 不同的数据产生平台,具备自己的特性,分析时需要充分考虑这些特性;
- 数据需要规范化,使属性数据按比例缩放;
- 可以使用某个干扰较小的数据集作为标准模板,再对其他数据进行分析;
- 文中除了分析火箭少女和NINE PERCENT外,增加了5位高人气明星作为对比,分别是国民偶像,港台天王,内地小花,新晋流量,影视流量。可以更直观的看出来在不同平台的情况;
- 数据清洗不仅需要去除无关数据、错误数据,部分数据来源可能会存在较多水分,通过一定的方式获得脱水数据;
- 关键词指数平台:微信指数、头条指数、百度新闻资讯指数、微博指数;
- 代表性的社交平台:微博、豆瓣、虎扑、小红书、抖音、知乎、贴吧、B站