利用Python进行数据分析 - 准备工作
2016-09-01 本文已影响0人
大圣软件
概述
该系列是关于《利用Python进行数据分析》的学习笔记。
涉及内容
主要介绍如何利用Python来进行数据控制、处理、整理、分析等方面的内容,涉及了多个在数据分析中常用的Python库:
- NumPy
NumPy是Python科学计算的基础包,本书大部分内容都基于NumPy以及构建于其上的库。 - pandas
pandas在吸收NumPy高性能的数组计算功能之外,还提供了复杂精细的索引功能,以便更为便捷地完成重塑、切片和切块、聚合以及选取数据子集等操作。 - matplotlib
matplotlib是最流行的用于绘制数据图表的Python库。 - SciPy
SciPy是一组专门解决科学计算中各种标准问题域的包的集合。
此外,还介绍了一种交互式的Python编程环境:IPython
。
安装配置
该部分没有遵从该书的内容,通过安装Spider来获得IPython环境。
具体而言,我安装Spider的环境是在Windows 10的64位机器侠进行的,安装过程可以参看Installation - Spyder 2.3。
之后,进入到Spyder的IDE环境中,输入如下代码进行测试:
import numpy as np
import matplotlib.pylab as pylab
pylab.plot(np.arange(10))
运行成功,得到如下图片:
test-1.png
相关数据
本书的代码及数据都存放在pydata-book - github上,记得下载吼。