数据分析第一步:明确你leader的需求目标
数据分析的第一步是明确需求目标,也就是准确理解你leader要你干什么、给你要什么。
对需求目标的准确理解建立在你对业务流程、业务逻辑、关键业务环节的理解基础上。明白你leader的需求目标后,看看要满足这些需求目标需要哪些数据、你手上有哪些数据,然后找到从数据到目标的一条路线(从目标到数据,反向倒推)(咱们经常把它叫做“思路”)。
比如,在常规数据分析方面我们常遇到的有一些描述性的数据分析(或者说数据统计),比如:
(1)上周中国内地票房排名前五的是哪五部电影;
(2)某几个区域的用户数及其所占的百分比、各个地区的性别比例,各个地区的青年、青少年、中年、中老年等各个年龄段的用户数及其比例;
(3)各个地区用户充值情况,充值金额排名前三的是哪些金额(是1元、2元、3元,还是4元、5元、6元),然后在对几个地区做比较,看看几个地区的情况有那些相同点、哪些不同点;存在相同点的原因有哪些?导致不同点的原因有哪些?
有时候还会遇到一些预测性的分析,比如:
(1)某部影片上映前,leader让你做个可以预测其在上映一个月时的票房是多少模型?
(2)假如你在一家共享出行行业中的某家公司上班,你leader让你预测某个城市每天的收入是多少的模型?
把上面两个模型叫做预测模型吧(还有别的名字吗~~)
上面的“用户数”,你要了解“用户数”的统计规则,是根据身份证号统计、还是根据注册手机号统计,或者根据其他方面进行统计。当然,在你进行A计算时,可能会采用根据注册手机号进行统计;而在进行B计算时,可能会根据身份证号进行分析,这要根据具体问题具体分析(又废话了)。
预测城市收入,你要了解整体业务体系,线上的、线下的,哪些是关键业务环节,哪些因素可以决定收入的多少,哪方面贡献的多、哪方面贡献的少,哪方面贡献的比较稳定、哪方面贡献的不稳定(有时候可以不从这个角度考虑,直接跳过这个层面),哪些因素是可控的(公司投入的资源)、哪些是不可控的(天气、政策),各个因素的权重如何确定、权重分别是多少等(在你用某个工具做预测时,权重就已经确定了,如SPSS、Excel、Python;然而有些实际情况就不同了)。
刚步入新行业的小伙伴可以跟一线人员多沟通、多交流、多请教(有时候会有人用异样的眼光看着你,或听你问的问题,心里在想这么简单的问题还要问)(多接触跟你工作有交叉的部门、多交流),多沉淀、多思考(沉淀需要时间的累积,捉急也没用,当然还是有天才的),很快你就会熟练。
上面是一些在工作中的个人心得体会,
希望能对刚步入数据分析行业的小伙伴有帮助,
欢迎各位同行吐槽!
2017年12月27日晚