数据分析是什么?
21世纪,比较热门的工作有哪些?
估计你随口就会答出:人工智能、数据分析、金融分析。
是的,这些热门工作与专业门槛相对较高,而且工资也不低。
以数据分析为例,在年薪方面,中国的数据科学家年薪约为20万人民币,工作两年后,这个薪水提高30%—50%并不困难。
image.png是不是,听起来就很诱人。
今天,我们就简单说说数据分析是什么?
数据分析科学家的崛起
数据分析科学家,在种类纷繁的职业中,还只是个新生儿。
这一词最早是在2008年,由D.J. 帕蒂尔和杰夫•哈默巴赫尔创造,随后LinkedIn和Facebook在数据和分析领域各领风骚。数据科学家在商业世界中崭露头角反映出一个事实:企业正在应对前所未有的庞大而多样的信息。
虽然市场上的企业大量涌现出了对数据分析这个职业的需求,但是我们不得不面对的是:所有的大学都尚未设置数据科学这个学位。
同样,数据科学家在诸多问题中也未有清晰的定位。比如他们应该扮演什么角色,这一角色如何才能创造最大价值,以及应该如何衡量他们的表现。
数据分析是什么?
数据分析的本质在于:利用事实的数据,对现状进行分析,从而推导出最形成事实的真相,形成相关决策的结论。
image.png
在这里,我们必须牢记数据分析的目的:产生决策的结论。
如果不能形成结论,指导企业的经营,那么数据分析并没有发挥它应有的作用。
数据分析的流程
综上,数据分析的本质在于解决企业面临的问题,我们可以按照解决问题的思路来理解数据分析。
1、现状是什么?
所谓的问题产生于企业经营过程之中,当企业现在相对于过去的预期发生了变化时,我们才需要用到数据。
举个例子,某个企业在市场投放了1000万元的广告费,预期会带来1亿元的销售额。但是只带来了1000万元的销售额,这个时候现状与预期就产生了严重的偏差,这回导致问题的出现。
2、发现问题。
既然现状和预期之间产生了偏差,那一定是企业在执行原来的决策过程中产生了一些问题。
问题出在了哪里?
这就是发现问题。
还是以上面为例,问题可能是:投放的平台不对,投放平台的比例不对,具体是哪个问题,还需要进一步探究。
比如,通过排除法。这家企业一直都在十家企业中投放广告,都没有出现这个问题,但是这次他们调整投放比例,导致了销售额的下跌,所以问题聚焦在:
投放平台的比例出现了问题。
3、数据的收集和加工
确认好问题之后,就需要找到相应的数据,可以从相应的数据库中获得。
获得数据后,利用数据清洗等功能,就可以筛掉不良数据。
4、数据分析
数据分析是解决问题的关键一步,主要需要使用统计学的相关知识,比如运用卡方检验来进行假设检验,建立预测模型,用回归分析来发现两者之间的相关性。
这一点是数据分析的重点。需要重点了解需要解决什么问题,得出什么结论,用到何种数据分析方法。
5、解决对策。
最终根据数据分析的结果,我们可以形成决策,而这才算完成了整个数据分析的流程。
成功的数据科学家应具备什么能力?
数据分析将成为未来大部分职业都需要具有的能力。
因为我们处于一个不断变化,且拥有很多数据的时代。
人们越来越不相信感觉,而一切都以事实——数据来说话。
在很多年前,孔子曾经说过“所信者目也,而目犹不可信;所恃者心也,而心犹不足恃。”按理说应该相信看见的,但是看见的并不一定可信;应该相信自己的心,但是自己的心也不可以相信。
所以,在数据的时代,一切都以数据说话。
数据分析师只是数据科学家的起点。成功的数据科学家应该是数据黑客、分析师、传播者和靠谱顾问的综合体,这样优秀的人非常罕见。
数据科学家最基本和普遍的能力是写代码。但比写代码更持久走俏的,是能够用所有利益相关者都能听明白的语言进行交流的能力。他们要能展示出用数据说话的能力,包括口头表达和形象化展示,最好两者兼备。
用数据说一个故事
所以,除了对数据进行分析之外,将数据能够以更通俗易懂的方式展示出来。
事实上,如何正确的展示数据,你可以把它理解成一个讲故事的过程。
image.png
这个故事会分为开头、中间和结尾三个部分。这三个部分可以用重复的策略来加强听众的记忆。首先告诉受众你准备讲什么,然后讲给他们听,最后总结所讲的内容。听到你的讯息三次之后,他们对应该了解和做什么都清楚了。
而讲故事的步骤,我们可以采用三个步骤:
第一、理解我们要讲的这个故事的中心思想。
我们可以从结论入手,比如我们的结论是:自产品C在2010年上市起,所有产品的市场价格都有所下降。
推导出,我们讲故事的中心是要围绕对市场价格随时间变化的分析,所有产品的价格对比图。
第二、选择合适的图表
在选择图表时,要充分考虑听众的感受。比如不要用3D图形,尽量用条状图或者柱状图。
避免图形的杂乱无章,要突出重点。比如,不要用不同颜色的线标标在同一张图上,可以将需要突出的线条重点突出。
比如,不要用两个纵坐标,会干扰听众的阅读,可以将两个纵坐标上下排列。
第三、讲故事
完成上面的步骤后,我们就可以设计我们的故事了。
可以采用时间顺序讲解,比如我们发现了一个问题,收集数据以更好地了解情况,分析数据,得出结论或解决方案,在此基础上得出建议的行为。
而在沟通中,将信息传达给受众的方法之一就是遵循同样的路径,让受众经历与我们相同的过程。如果你需要与受众建立信任,或者你知道受众关心这一过程,这种方法会很有成效。但时间顺序并不是你唯一的选择。