数据分析和数据科学的发展方向,具有巨大潜力的工具和技术
来源:CPDA数据分析师网 / 作者:数据君
未来几年,数据分析/数据科学将走向何方?
在接下来的几年中,我将看到三个关键主题:实时流,垂直化和启动,我们看到了数据科学家和分析师使用的数据类型的这种转变,从静态数据集转变为实时数据流,我认为数据分析和BI工具正越来越多地针对垂直行业而不是通用,与仅更一般地进行图像分析相比,驾驶汽车或选择应在何处发射医用激光是一个难题,并且需要对问题涉及的工作流程有更深入的了解,我们正在从一个数据科学仅涉及分析的世界转变为将分析与行动实际联系起来的世界,传感器没有价值,除非您有可以连接的执行器,数据科学家越来越多地参与将见解与行动联系起来。
CPDA数据分析师有没有今天不流行但有很大潜力的工具或技术?为什么?
创新和大数据分析中最有趣的领域之一是统计近似值,大数据算法的第一个时代着眼于大规模获取准确的总和,计数和平均值,那是很强大的,但是我们现在看到一类算法被更频繁地使用,可以在处理成本和处理精度之间进行权衡,这有点反映了自然系统通常如何大规模处理数据,眼睛不会保留命中其检查器的每个光子的100%-同样,许多数据处理和大数据堆栈不需要保留所遇到的100%的数据即可快速获得近似洞察力。
作为分析师/数据科学家,您最喜欢的部分是什么?您最不喜欢的部分?
成为数据分析师最有趣的部分是将数值数据映射到视觉见解的艺术,如何将时间序列映射到颜色,轴和形状中涉及很多艺术,这就是分析师可以成为艺术家的地方,毫无疑问,最不有趣的部分是数据“监控”和准备-在大多数情况下,您花费80%的时间来获取,构建和准备数据,而仅花费20%的时间来进行分析,我们正在尝试进行更改,以使唾手可得的数据变得更容易。
您现在是否正在做有趣的事情?如果没有,您的梦想项目是什么?
我相信最强大的数据可视化是简洁的表格,并且我热衷于寻找将信息的表格显示方式带入现代时代的方法,这是我正在探索的事情,我也很兴奋,我们目前在与程序营销领域中的许多领先公司一起开展的所有工作,为他们提供了更好的方法来将大量拍卖数据转变为交互式可视化很快。
如果您可以回到过去,那么作为新的分析师/数据科学家,您会告诉自己什么?
作为数据分析师,您经常需要对我们的数据集进行一系列转换,获取见解之路上最重要的事情是正确管理该转换过程,在那条路上保持理智的唯一方法是使您的工作自动化,以便您知道如何完成每个步骤,没有企业转换流程的数据分析人员常常最终无法重复他们的分析,因此我要给自己的建议与通常给传统科学家的建议一样:使您的实验可重复!