数据分析工具鄙视链:Python成老大,Excel小弟都称不上?
佛说,一切众生相皆是无相。数据分析做到极致,也可以“无相无生”。
在说今天的话题之前,我想先抛出一个结论:
“做数据分析,不要建立一种以掌握的软件来给自己分级的心态,但是一定要用工具避免误入职业发展的歧途!”
为什么今天要谈关于数据分析工具分级的问题呢?
其实这涉及到职场中一个非常常见的现象——工具鄙视链:
会python编程语言的,瞧不起用自助BI工具做数据分析的;
会用Tableau、FineBI这种分析工具的,瞧不起会用SPSS、SQL这种数据工具的;
会用SPSS、SQL的,瞧不起用PPT做数据汇报的;
会用PPT做数据汇报的,瞧不起只会用Excel做数据统计与整理的;
逃不开的鄙视链
不光是数据分析行业,在程序员、产品经理等行业中都存在这样的鄙视链
也有不少人和公司,遵从着这样的鄙视链现象,通过这样的鄙视链进行岗位的分级,或者作为选人招聘的门槛标准
而这个鄙视链似乎是与这个岗位生死同戚、共生共存、难以分离的:
比如我,在前几年我还刚接触数据分析的时候,只学会用Excel做数据处理,所有的数据清洗、数据加工和图表可视化工作都是用Excel完成的
但是看着网上很多人都在学Python编程,当时还有一种“python才是数据分析标配”的言论,我也成为了跟风的一份子
当时带我的老大就告诉我:
“网上说学python才能做数据分析的,纯粹就是放屁,python做数据分析确实比Excel要专业一些,但是真正的核心,是要是什么数据场景和什么人在用。
我用Excel做的数据清洗绝对能完爆这些工具,但是我想做一些高级可视化,也会用python去做,谁规定数据分析师只能用一个软件了?
说到底还是出于对数据分析岗位的自卑,数据分析才出现几年啊,谁都觉得用Excel做数据分析太low逼了,一点体现不出我们的专业性,不学一门编程语言,其他部门的人谁瞧得起我们?”
对于我老大的话,我深以为然,正是出于对于数据分析作岗位的错误认知,才会造成那么多人对于数据分析工具的误解
其实这么多年,excel、Tableau、FineBI、PowerBI、SPSS、Python......我几乎每种工具和软件都用过,并没有觉得哪一种是最万能的
工具从来只是工具,是用来辅助我们进行数据分析的,最核心的关键还是在于人,也就是你是否真的具有数据分析思维和能力
像我之前老大的能力,用Excel照样牛逼;要是没有能力,学一万种语言都没用!
所以很多刚入门数据分析的朋友,一上来就买很多Python,R语言,VBA的书籍和资料,安装了各个语言的环境
但其实数据分析师的日常工作,最多就是用到SQL取数以及Excel数据透视图、BI分析工具中拖拉拽图表
所以,会用工具不是能力,懂得数据思维,才是数据分析师存在的意义
工具是辅助
那么回到我们今天的话题,数据分析当中有着不同的数据场景,会用到非常多的工具,那么应该如何选择,下面简单举几个例子
1、excel
别以为EXCEL只会处理表格,你可以把它当成数据库,也可以把它当成IDE,甚至可以把它当成数据可视化工具来使用
它可以创建专业的数据透视表和基本的统计图表,但由于默认设置了颜色、线条和风格,使其难以创建用于看上去“高大上”视觉效果
尽管如此,我仍然推荐你使用Excel
2、BI工具
近几年冒出来的BI之秀,如TB、qlk都强调可视化,一改传统BI工具SAP BO、IBM家的cognos(不过近几年貌似都在研发云BI)
这里不谈开源,还没见到能成熟应用的BI,成熟的BI工具如FineBI(国内)和 Tableau(国外),都很推荐
3、python
学过Python数据分析的朋友都知道,在可视化的工具中,有很多优秀的三方库,比如matplotlib,seaborn,plotly,Boken,pyecharts等等,这些可视化库都有自己的特点,在实际应用中也广为大家使用
4、SPSS
SPSS是统计分析入门软件,如果你想快速入门而又不想学习编程,我推荐使用SPSS
学习SPSS的重点并不在于软件本身,而是相关的统计学知识,这也是在前面建议大家铺垫的,也就是你要学会怎样去分析“输入数据后,软件给你呈现的结果”
推荐大家一本书:《如虎添翼 数据处理的SPSS/SAS EG实现》,徐筱刚老师写的,十分适合SPSS新手入门
最后说点啥
其实今天谈的这个话题,也是其他行业里常见的现象之一,既然产生了这种乱象,说明一定有其产生的原因与逻辑,我们不必太过敏感
但是,对于我们数据分析师自身而言,真正做分析时候,你会发现市面上有太多的分析工具,需要掌握的实在是太多了
其实不必纠结于此,依据个人能力,配合当前的数据分析环境,适用的工具自然会被选出,最后记住一句话:工具是人用的,重点在于人,而不在于工具!