数据分析-如何进一步学习的思考
2018-03-22 本文已影响0人
AnthRax
自我反省
经过一周的统计学学习、自我评估后感觉进展缓慢。
主要原因
- 很多的时间花费在了数理统计方法、太多的数学原理性的证明知识。
- 求大求全思维,我觉得求全思维固然好、但是在精益求精的基础上来做比较好、目前有更多ROI更好的东西可以学习、暂时放下刨根问题。等后面回过头来再说,在找正态分布意义时候、分叉了很多东西、我需要聚焦。
接下来怎么做
1. 定目标
再次梳理 数据科学家的能力模型
网上有几张有意思的图片
英文版数据科学家技能知识图谱
中文版数据科学家技能知识图谱
男女版现代数据科学家技能分析
数学科学家最重要的25技能调查
2.从实际运用过程中找方法
数据分析的流程
问题到数据,数据到信息、信息到价值 --- 林荟
数据分析是一种手段。人们使用数据分析的最终目的就是解决问题、产生价值。
数据分析一般流程 -- 林荟虽然从时间占比上、数据处理会花掉比较多的时间、但是整体流程上来讲、最重要的事情是
-
定义问题
这里比较重要的是行业知识、沟通能力 -
选择模型
要对主流的模型有了解、能选择合适的模型 -
应用模型
数据可视化、讲故事的能力、评估成果的阶段
3. 明确方向
对于现在我来说、最需要做的事情是对各种模型的熟悉、能在分析中使用合适的模型是当前最需要提高点。
做一个知道在哪里划线的人,加油!
知道划线的人
美国有一家航空公司、有一家飞机发动机出现故障、倾尽全力都无法修复、于是请了德国的专家过来解决。德国专家调查后、在发动机一个地方划了一条线、命令工程师在这里减少15圈线圈的缠绕、于是发动机就回复正常了。经费结账时、专家说需要收费1万美金、大家都觉得价格昂贵、专家说的确划一条线只值1美元、但是知道哪里划线我收费9999美元。
所以应对今后的大数据分析来说、市面上各种、R、Python、SAS、SPSS等分析工具都是工具层面的东西、只属于划1条线的价值、但是选择什么模型、如何解决问题才是属于知道哪里划线的价值。