数据分析-从入门到崩溃
Hello World !我是有毒的聂大哥~
今天我来散播一发数据分析毒教程~
听说很多人想走数据分析这条路......
我劝你,还是直接从入门到放弃吧......
作为一名半桶水的商业分析在读研究僧,今天给大家列一下,数据分析这条路上的妖魔鬼怪们~
乖乖们,听大哥一句劝:
1. 统计
统计需要掌握的姿势:
- Descriptive Statistics
- Probability Concepts and Probability Distributions
- Sampling Distributions and the Central Limit Theorem
- Confidence Intervals
- Hypothesis Testing
- Analysis of Variance
- Chi Square and Nonparametric Tests
- Simple and Multiple Regression
想躲过统计???
入门课收好,Coursera 上阿姆斯特丹大学的 Basic Statistics,卡通配图教学,和萌萌哒的你最配!!
- University of Amsterdam:Basic Statistics | Coursera (旁听免费)
喏,还有一本简洁易懂的 step by step 英文教材,也是我们课上用的教材~
- Basic Business Statistics by Mark L.Berenson & Others
2. SQL
常用语句来来回回就那么几个,但是要熟,要熟,要熟!
简历上有 SQL 技能,很重要!!!很重要!!!
常用语句总结:SQL Quick Reference From W3Schools
再送你一门超好,超好,超好的 MySQL 课! Coursera !杜克大学!我太喜欢教课的那个温柔美丽的大姐姐了~
3. R
R 和 Python 谁才是数据分析一哥,江湖上已经争论很多年了,至今没有定论...... 事实大概是 Python 的主要功能是编程,除了单纯的数据分析,在很多领域还有广泛利用,所以就业市场上对 Python 的需求是远大于 R。
R 主要侧重统计功能,在统计方面显示出了很多的优势,用 R 做单纯的数据分析还是妥妥的稳稳的。但是往数据科学方向走的话,R 就有点顶不住了,轮到 Python 扬眉吐气了......
这两门语言我都渣,只能说个大概,大家还需要自己去摸索这两门语言的美~
我学 R 上的课是 Coursera 上 Johns Hopkins University 的经典 R 课程和在 Data Application Lab 实习的时候上的商业分析师培训课。Coursera 的那门课我上得不太走心,默默吐槽一下课程莫名散发着浓浓的时代感,老师有点面无表情,比较打击我的学习激情...... 好吧,我知道我作......
后来实习的时候上公司的培训课,教 R 的是个讲话干脆利落的小姐姐,才让我重新喜欢上 R......
作为一名主观上比较站 Python 的小粉丝,我目前学过的 R 就这么多啦!!大体了解了 R 的语言思维,碰到不会的问题再 Google 找代码就差不多了~
另外,我在 Udemy 上找到一门 R 的课,看课程设置觉得还是挺不错的,想学 R 的可以试试~ 关于 Udemy 上课程的价格补充一句,原价是吓人的,常年打折,但是打折力度经常变来变去的,最便宜的时候一般是 10-20 块的价格可以买到好课...... 下面这门 50 刀的课我觉得可能会打到更低~
4. Python
Python 是一门可以让人浑然忘我的语言......
这辈子学过韩语、日语、英语,和一丢丢 R,但 Python 是我学得最有激情的......
学 Python 的时候正值跟亲爱的先生异国半年,Python 的存在大大缓解了我对老公的思念!!!
最沉浸的那段时间里,不管几点回家,晚上睡觉前一定要看一点 Python 爬虫才能安心睡下,晚上做梦也是爬虫代码......
我最开始接触 Python 的时候上的课是 Coursera 上 University of Michigan 的经典系列:Python for Everybody,里面包含五门专项课,除了最后一门 Capstone,其他四门都刷过(没写作业)。
这门课非常实在,内容非常赞,上课的是个亲切的老爷爷,学下来有助于你系统了解 Python 的功能~ 个人感觉 Using Python to Access Web 对于纯小白来说可能有点难度~
提醒一下,如果你搜 Python for Everybody,会发现...... 要交钱上啊!!!省钱小 tip 就是在搜索栏里一门一门搜专项课,进入专项课的页面就可以免费旁听了...... 同理适用于 Coursera 很多其他的系列课程。
University of Michigan: Python for Everybody | Coursera
- Programming for Everybody (Getting Started with Python) | Coursera
- Python Data Structures | Coursera
- Using Python to Access Web Data | Coursera
- Using Databases with Python | Coursera
- Capstone: Retrieving, Processing, and Visualizing Data with Python | Coursera
密西根大学还出了 Python 的数据科学进阶课,包含了数据分析、画图和机器学习等内容:
- University of Michigan: Applied Data Science with Python | Coursera
另外,我还追过大神 @秦路 的运营大湿兄知乎专栏,从“开始 Python 的新手教程” 到“用 Python 分析用户消费行为”,一共六篇文章,超快速入门 Python 数据分析。
Udemy 上也有一门很棒的 Python 数据分析课,我目前在上,觉得好棒棒~
教 numpy、pandas、画图、带着练三个数据小项目,至此觉得内容量已经很良心了,老师竟然还教机器学习!!! 20 个机器学习视频,用 SciKit Learn 这个包!还有还有! 11 个统计视频!还没完还没完!还有几个 SQL 和 Web Scraping 的小视频!满满的良心学习大礼包~
想必还有很多盆友们对爬虫充满了兴趣......
学爬虫当然要看崔庆才大神的系列教程啊!!!
文字版教程免费,使用的是 Python 2.7 版本↓
视频教程 499 软妹币,之前有过折扣,印象中 270 多~
如果你只是比较随意,不想玩那么高深,或者你真的和我一样穷,可以看看文字版教程,了解 urlib 库、Requests 库、BeautifulSoup 库、Selenium 库以及正则表达式后,跟着崔大神的三个免费 case 练一遍~ 我觉得对于小白来说就差不多了~
对于数据分析师来说,会爬虫不属于必备技能,那么学爬虫的意义是什么呢?大神 @董伟明 在他接近满分的“爬虫从入门到进阶”的 Live 简介中说得直戳心坎~
5. Tableau
终于,数据分析界的女神出场了!!!让我们大声喊出她的名字:T! A! B! L! E! A! U!
读作“ Tab-low ”!!!
我身边很多学 Tableau 的孩纸们,反应不是酱紫的,
就是酱紫的......
纷纷表示在这个看脸的时代,要好好学习女神软件......
( Source: Best Practices for Designing Efficient Tableau Workbook )
凭借着打娘胎起就异于常人的颜值,Tableau 迅速蹿红,逐渐渗透进业界和美国高校。对于在美帝的数据分析师来说,Tableau 也是简历上必备的技能之一。
我目前觉得学习 Tableau 的最好方式,还是去 Coursera 上上杜克大学的那门课,基本涵盖入门到中高级操作,墙裂打 call,墙裂推荐!!!真的好喜欢教课的杜克大姐姐......
另外,Tableau 为了推广自家软件,在免费培训方面也是做得很拼......
还有很多很棒的 Tableau 使用者的 case 展示~
还有 Moveover Monday Project,每周一 po 一个数据集和数据分析展示~
至于有些人说,下载都这么贵,土豪才学得起吧...... 只要你乖乖去上 Coursera 杜克大姐姐的课,会有惊喜......
6. Excel
无论你多喜欢 Excel 或者多不喜欢 Excel...... 作为数据分析师,简历上有 Excel 技能也是必备......
最重要的当然是会 Pivot Tables~
我也是通过 DAL 的商业分析培训课学的 Pivot Tables,如果你只想学 Pivot Tables,可以去 Udemy 上这门↓
当然,还有一个免费的学习神器,YouTube 啊~ 哈哈,Pivot Tables 一搜一大把~
我真的非常热爱 YouTube,基本没有 YouTube 不到的姿势......
7. Forecasting
预测 /时间序列也是我们数据分析僧要掌握的技能,不过学得比较浅显,大概了解几个预测模型的原理和会用软件操作就行了。我们用过的教材是 Business Forecasting,有中文版,不过我相信你不会想看的......
Udemy 上依旧有药!介绍 Moving Average, Simple Exponential Smoothing, Double Exponential Smoothing / Holts, Winters / HoltWinters 等模型以及在 R 和 Tableau 中的操作。
如果你对 Tableau 女神是真爱!可以去上 Udemy 新课,目前评价 4.7 分,感觉还挺不错的样子,反正是安利到我了~
8. Data Mining and Machine Learning
想当年,刚接触数据时,我还是个蠢萌的宝宝,在听说“ Machine Learning ”这个东东的时候,内心是下面那样的......
何方的妖魔鬼怪,尼玛听名字就不明觉厉......
入坑数据分析一年,但才刚接触机器学习一个月(网课加这学期修的数据挖掘专业课),感觉难度明显拔高了一级,但越学越刺激,越学越稀饭~
目前还是个渣渣,不敢瞎说,就大概罗列一下机器学习入门需要掌握的知识点和网上的学习资源吧:
- Linear Regression
- Logistic Regression
- Decision Trees
- k-Nearest Neighbors
- Naive Bayes Classification
- Discriminant Analysis
- Neural Nets
- Support Vector Machines
- Cluster Analysis
- Random Forest
- Natural Language Processing
如果没听说过吴恩达男神的机器学习王牌课程,那你一定是假的数据猿......
说实话,没上男神的 Machine Learning 前,我还挺不理解为什么这个看上去其貌不扬的大叔,有这么多死忠信众...... 每次大叔的动向更新,都跟地震一样...... 娶的老婆还是跟他智商一样上天高的女神大牛!约翰霍普金斯的 CS 博士......
如果你和曾经的我一样迷惑,请去 Coursera 上课...... 顺带必须提一句,男神还是 Coursera 的联合创始人啊!!!我的前半生没有 Coursera,但是后半生必须要跟 Coursera 紧紧相依......
反正现在的我是痛哭流涕着入吴恩达教了......
之前我在 Python 部分介绍的 Udemy 的 Python 数据分析课中,也涉及一部分机器学习的内容:
内容设置很赞,也很系统的数据科学课程还有:
- University of Michigan: Applied Data Science with Python | Coursera
以上就是我总结的一些数据分析经典姿势~ 其实还有 Decision Analysis (主要讲概率)和 Optimization,大家就自行去 YouTube 吧,视频很多~
一年前的今天,我没开始刷网课,不会 SQL,不会 R,不会 Python,不会 Tableau,不懂 Forecasting,更不知道机器学习是什么鬼...... 就修了两门专业课,统计和 Optimization ( Excel Modeling ),仅此而已......
按照这份教程一点点啃完,其实你也可以在家 DIY 出半个名校学生(如果不提名校的校友资源和 networking 机会等的话)~
大家可以再参考一下几个美国出名的数据分析项目的课程设置:
- University of Texas -Austin | MS in Business Analytics
- USC | MS in Business Analytics
- University of Chicago | MS in Analytics
最后再来个励志的故事,我最新关注的一个 YouTuber,Harrison Kinsley。小哥毕业于 Sam Houston State University (懵逼脸),专业是 Philosophy and Criminology (茫然脸),毕业后就开始创业,自学 python 编程,并在网上 po 免费 python 教程,还创立了一个python 学习网站,YouTube 上目前有 27 万多粉丝。
如果你好奇小哥怎么赚钱存活?小哥说,他一周就能接好几个 offer...... 你们没听过的公司一堆一堆的,全宇宙人民都听过的大公司Facebook和Apple的 offer 他都有...... 另外他还做咨询赚钱,生计完全不愁......
既然你都读到这儿了,看来也是数据的真爱,那就赶紧和我一起学到昏厥吧!