python转型数据分析、机器学习、人工智能学习路线
最近1年的主要学习时间,都投资到了 python 数据分析和数据挖掘上面来了,虽然经验并不是十分丰富,但希望也能把自己的经验分享下,帮助到更多想转行python数据分析和人工智能的朋友,给广大同学朋友规划个适合学习规划。
我大学学习的应用化学,后来毕业做了2年全栈设计师(PS:设计和前端都不熟练的那种),后来出于对爬虫开发的喜欢(爬图片、爬视频)还有人工智能、机器学习、大数据的火热程度的追捧,毅然决然报了培训班,在深圳培训了半年python,后来出来找工作,在期货交易所工作,主要工作是数据处理和分析、机器学习、自然语言处理、图像处理等,项目是一个全自动化智能云测试云平台,现大概讲下想转行数据分析、机器学习、人工智能应该必备的知识和学习路线
在这里相信有许多想要学习大数据的同学,大家可以+下大数据学习裙:957205962,即可免费领取套系统的大数据学习教程
转行数据分析(机器学习、人工智能)学习路线:
0、学习python基础语法知识(ps:0是第一个公众号回复:python)
1.学习MySQL,能熟练对数据库数据的增删改查命令,面试也会经常问到
2.学习正则表达式,用于数据的提取 re模块
3、前端入门html\css\jquery,用于分析网页页面结构
4.学习爬虫技术,熟练掌握requests、scrapy模块,可以从网络上爬很多数据源,用于分析统计(转行数据分析可以先从爬虫做起,公众号回复:爬虫)
(以下几个模块是数据分析最常用的库,一定要学好)
5.学习科学计算和分析包,numpy 和 pandas(公众号回复:数据分析)
6.学习可视化,分析结果可视化的包 matplotlib,实现数据绘图展示
7.学习数据挖掘模型,这个包主要是 sklearn,里面的算法基本都有对应的包,但希望大家能对高等数学、概率论、线性代数、信息论的基础理论进行学习,这些算法都是基于数学基础,如果数学理解不透,也只能当一个调包侠(公众回复:机器学习)
8.神经网络的框架,推荐学习 TensorFlow 或者 keras,karas 是把TensorFlow 封装起来的高级包,学习难度比较低。还有一个更加高级的框架 caffe,据说很厉害。
9.常见神经网络:回归网络,分类网络,卷积神经网络(CNN)在图像语言等领域处理方面优秀,循环神经网络(RNN)利于时间序列分析分析,长短时间记忆(RNN LSTM ),避免过度拟合。自编码网络,这个我不了解,也不感兴趣。神经网络还很多,技术前沿的东西还不知道。
10.如果你想做正规的 Python 工程师,需要学习面向对象,掌握面向对象思维,无往而不利
数据分析要不要学高数、概率论、线性代数?
如果不想只当调包侠,也不想在工作中因为不理解数学过程太痛苦的话,多补补数学理论吧,至少我工作中接触到简单的数学概念有:标准差、方差、协方差、协方差矩阵、余弦相似度、导数、对数、偏导、概率论、熵、信息论、矩阵运算、向量的运算等等。只能说列举的这些是基础中的基础,比这更难的我也正在学。
数据分析要不要学后端框架?比如django和flask
以上过程是一个快速转行数据分析的路线,可能有些介绍不是太全,但大致的学习方向就按这个来,就会少走弯路,但其实作为一名python开发者,个人建议最好还能运用一种后端框架,能够搭建web后端项目也很重要,虽然在公司工作是数据分析,但是公司经常可能性的会让搭一些简单的项目,艺多不压身,我个人喜欢用django
数据分析要不要学前端?(html、css、js)
回答是肯定的:必须学,能阅读懂是基本,越熟练深入越好,因为做数据分析很多都是从爬虫和web转过来的,而爬虫和web都对前端技术有一定要求,比如如下原因:
爬虫读取页面结构,获取标签,你要能看懂HTML
爬虫的很多反爬虫措施基于厉害的js代码和一些复杂的css,如果不懂,爬虫很难做到深层次
后台项目,至少在PC端的,很多情况下,都要求后端开发人员能读懂前端代码
Python 数据分析是一个非常专业的方向,需要有较多的数学理论知识,而且需要有刻苦专研的精神。既然是编程语言,就需要写很多代码,我至少写了 10k行代码了。最后你还需要了解你自己希望从事什么行业,传统数据挖掘在银行,保险,电信,电商等领域已经很普及了成熟了。对于那些高级的神经网络,也就是类似AI 领域,在图片语音视频识别,自动驾驶,量化投资,机器人等领域有很好的。很多分析师都转行做这块了,还是话说回来,想学习的很多,多实践,加油!
经验有限,不足之处欢迎指正!