Python 与 Data Science大数据分析机器学习

如何开始数据科学的学习:Python篇

2016-10-25  本文已影响53人  那口虫223

自从《哈佛商业评论》宣布,“数据科学家”是二十一世纪最性感的职业之后,数据科学方面的工作就越发增多,薪资也变得很高。对于数据科学来说,现在是发展的黄金时期。这是个新领域,但增长迅速,同时数据科学家的缺口也很大,据说他们的平均年薪可以达到10万美元。哪里有高薪,哪里就吸引人们,但是数据科学技能的差距意味着许多人需要努力学习。

如何从头开始学习数据科学,我认为数据科学就是解决三个问题:

  1. data pre-processing;(数据预处理)
  2. data interpretation;(数据解读)
    3.data modeling and analysis.(数据建模与分析)

数据科学其实就是门复合型的技术,既然是技术就要从编程语言谈起:

Python这门语言对于数据科学是非常重要的,Python拥有着极其丰富且稳定的数据科学工具环境。因为是关于数据科学,我就不推荐直接关于Python语言的书。


1687.390.big.jpg

本书基于易于理解且具有数据科学相关的丰富的库的Python语言环境,从零开始讲解数据科学工作。具体内容包括:Python速成,可视化数据,线性代数,统计,概率,假设与推断,梯度下降法,如何获取数据,k近邻法,朴素贝叶斯算法。可以用于入门,了解数据科学的基本工作流程。

38428封.jpg

贝叶斯正在变得越来越常见与重要,对于数据科学来讲,用到的地方很多。本书简要介绍了贝叶斯统计法,用python建模,案例很多,很有意思,比单纯的介绍贝叶斯统计学要容易理解。

2710905-fm.jpg

《利用Python进行数据分析》适合刚刚接触Python的分析人员以及刚刚接触科学计算的Python程序员。介绍了NumPy(NumericalPython)的基础和高级知识;从pandas库的数据分析工具开始利用高性能工具对数据进行加载、清理、转换、合并以及重塑;利用matpIotlib创建散点图以及静态或交互式的可视化结果;利用pandas的groupby功能对数据集进行切片、切块和汇总操作;处理各种各样的时间序列数据。

关于python篇的介绍就到这了,除了看这些书,可以在网上的MOOC上找一些关于数据科学的视频课程可以看看。下一篇我就来介绍R语言的如何开始数据科学的学习。

本人介绍:老实人一个,python爱好者,刚刚进入数据科学

上一篇下一篇

猜你喜欢

热点阅读