知乎数据分析笔记
2020-09-05 本文已影响0人
Pingouin
Ref: 数据科学家 (Data Scientist) 的核心技能是什么?
数学
至少线性代数(Linear Algebra)基础
最好还有数值分析(Numerical Analysis)和统计(Statistics)的基础
编程语言
Python
R,SQL,Tableau,这些面试中也经常出现,实战中也常常使用
编程能力
最好能把数据结构(data structure)学完,这样能在数据科学项目建模的时候也能更加顺畅
建模能力
- 对所有建模方法,都需要理论知识掌握+实际可以用Python或者R建立出来。重要模型包括不限于:所有的regression,classification,clustering,NLP,deep learning,A/B testing
- 《Introduction to statistical learning》作为机器学习入门首选的一本书,涵盖面很广,而且通俗易懂(这本书在我的资料里面送)
- Coursera的Machine Learning课程,是大名鼎鼎的Andrew NG教的,很扎实地入门数据学科和机器学习的从无到有
练习方式:
对于所有的机器学习方法,都要用笔记本记录它的理论依据,优点和缺点
英语能力
至少能看懂单词意思和基础语句,这个对编程至关重要
练习方法
- 对于所有的Python或者R常见的语法结构,用笔记本详细记录,这样在之后使用的时候会很方便查看已经熟能生巧。
- SQL的练习我建议在熟悉了简单的语法之后,去Leetcode上去练习sql的题。基本上把Leetcode上题目都做出来就能出山了
- Kaggle竞赛,是一个网上可以参与的数据科学竞赛,建议在数据科学学到一定程度的时候可以和队友一起参加,能完整体会到数据科学项目从0到1的一个过程
- 练习商业/产品直觉,用英文说就是Business / Product Sense。这种练习其实一般是最后一步,但是却是最重要的:也就是当你的分析/模型都已经有结果了,如何把这些结果转化成真正有用的商业结果。我推荐的练习方式是在自己平时的学习过程中,每遇到一个问题,都去思考一下可能出现的不同模型结果和相对应你会传达出来的Business Insights。同样可以看一本书叫:《30 days Facebook PM Study Guide》,读完了也会有很大帮助