国内数据分析工具使用现状调查报告
前言
近些年,随着越来越多的企业对数据价值的认识不断提升,数据分析工具得到了前所未有的关注,特别是以自助式BI为代表的分析产品。据知名调研机构Gartner预计,到2019年,使用自助式BI产品的用户将超过专业的数据分析人员。与此同时,在人工智能、机器学习等前沿技术的推动下,数据分析工具也正在向着自动化、智能化的方向发展,未来,数据价值也势必会得到更好的挖掘和体现。
近期,为了进一步了解数据分析工具在企业内部的应用情况,国内知名数据可视化分析展示厂商DataHunter联合CDA数据分析师共同开展了《数据分析工具使用现状》的在线调查活动。本报告正是以此次调查数据为基础,可在一定程度上反应出国内数据分析产品的应用现状和未来发展趋势。
样本描述
1. 参与调查人员年龄段分布
以21岁-30岁年龄段为主,占到了总人数的66.7%,30岁以上人群占比为32.9%。可以看出,从事数据分析相关工作的大都是年轻人,这也从侧面反映出数据分析仍是一个比较新兴的行业。当然,随着企业对于数据分析的需求愈发强烈,相信会有更多的年轻人加入这一领域。
2. 参与调查人员行业分布
参与调查人员的行业分布较为广泛,但主要以金融、电商、零售、教育、互联网、广告营销等行业为主。这在一定程度上也反映出,目前这些行业对于数据分析的需求最为强烈。
3. 参与调查人员职业分布
数据分析师占比最多,达到了32.5%,其他还包括运营人员、技术研发、产品经理、市场人员、财务等。从职业分布情况看,销售人员占比较小,也表明目前还有很多国内企业并未将数据分析产品应用到业务层,未来,随着数据分析与业务发展的结合愈发紧密,相信此部分人员的比重会越来越多。
报告要点
1. 近半数受访者已抛弃Excel
从调查结果看,53%的受访用户经常使用Excel作为数据分析工具,使用第三方工具或Python、R等开源工具的受访用户分别占到了26%和21%。作为微软Office系列的代表性产品之一,Excel在全球拥有广泛的用户群,虽然其可以作为数据可视化工具使用,但如果在企业级的环境中,面对海量数据的处理和分析,Excel则难以胜任。
针对大数据的处理和分析,不仅需要丰富的产品功能和响应速度,还要求数据分析产品具备较好的易用性。Python、R等开源工具虽然功能强大,但需要使用者具备一定的编程能力,使用门槛较高,而相对来说,更多的受访者会选择第三方数据分析工具。
2. 数据清洗、整理过程最占用时间
在整个数据分析过程中,有41%的受访者认为数据清洗、整理(ETL)过程占用的时间最多,其次是分析过程、整理汇报、收集数据以及数据建模。如果我们结合上一项调查结果,不难发现,这正是由于大多数受访者仍在使用Excel作为分析工具。
其实,以自助式BI为代表的新一代数据分析工具,如DataHunter,最大优势之一就是帮助业务人员和分析师简化ETL过程,系统在上传数据或对接业务系统的过程中,就完成了初步的数据整理,再通过简单的数据关联(建模过程),就可以开始进行数据分析。
3. 全维度数据钻取等分析功能需求明显
在日常工作中,有23%的受访者表示希望借助数据分析工具完成数据统计、筛选、钻取等操作,这说明,目前此部分用户所使用的分析工具并不具备这些功能。此外,也有20%的受访者希望通过数据分析工具完成整合工作。
值得注意的是,基于分析结果的分享和协作,也成为目前数据分析师的需求点之一。在此次调查中,有12%的受访者希望分析工具具备此项功能。Gartner在今年发布的《2018分析和商业智能平台魔力象限报告》中也特别强调,共享协作将成为未来商业智能产品的标配功能之一。
4. 简单、智能是未来数据分析工具的发展方向
对于未来数据分析工具应具备的特性,分别有32%的受访者认为是操作简单、人人可用以及智能分析预测。随着对数据价值认识不断提升,企业各部门、各角色都开始注重通过数据分析来进行业务决策,产品的易用性便成为使用者最为关注的产品特性之一。同时,随着人工智能、机器学习等前沿技术的不断推动,相信自动分析、预测分析也即将成为现实。