如何提高取数的效率
所谓取数需求,就是业务团队根据业务需要,提出的希望分析师能从数据库中提取的数据内容。在一些业务快速发展的企业,数据需求处理往往占据了数据分析师非常大的工作量。对于初级数据分析师来说,可能占据了他们80%左右的工作时间。很多数据分析师发现,特别是初级数据分析师在工作一段时间后。天天都是拉数据,处理为完的数据需求;公司的大数据平台或者数据仓库建设不是那么完善,数据提取效率比较低。
今天结合数据提取的过程进行分析,看提高数据提取的质量和效率都需要哪些能力?提取一个数据需求要经历的过程有:
1、前期的需求理解
数据提取的背景,提取的目标,要解决的问题,谁在使用?
数据提取的内容,指标口径定义?
2、中期的统计结果计算
提取方案设计、数据源以及表字段查找、代码编写、跑数据、结果准确性验证
3、后期的数据输出
结果整理成业务同事可理解的形式、增加口径定义说明、代码归档、数据输出给业务方以及使用的跟踪。
从上述可以看出,取数技能可以分解成业务理解、数据理解、系统理解、业务与数据映射、人际沟通、代码编写、工具使用、输入输出等组成部分。
提高取数效率,做一个合格的取数人员很不容易,特别是成为专家型的人物,更是要付出巨大的代价。不仅要专,知其然知其所以然,能够理解源系统数据,理解数据仓库模型的本质,能够将数据和底层数据真正连接起来。更要融合多领域的数据,充分发挥数据的价值。但即使这样,取数人员的职业天花板也是很常见的,基本2-3年就可以很熟很上手了。
除了提高取数人员的本事能力,更重要的办法是实现自动化、平台化。临时性的分析需求千变万化,造成了取数工作的不确定性。但是它也是有一定规律的,可根据业务场景,探索常见的分析内容,将其固化。当然,取数平台建设比较困难,除了体验要好,性能要高,还要去做持续性的运营。但是取数人员始终要有自动化的心,建设以及运营好取数这个平台,充分发挥自己的价值。