《利用Python进行数据分析·第2版》【Chapter 2】引

2018-05-18  本文已影响0人  蜘蛛的梦呓

【Chapter 2】引言

看数据分析第一版,发现越到后面,小毛病就越多,严重的耽误了进度,只好看第二版的电子版笔记 了,我会根据这个笔记写文章(可惜了我的第一版书)。

本书大部分内容关注的是基于表格的分析和处理大规模数据集的数据准备工具。为了使用这些工具,必须首先将混乱的数据规整为整洁的表格(或结构化)形式。幸好,Python是一个理想的语言,可以快速整理数据。使用Python越熟练,越容易准备新的数据集以进行分析。

2.2 IPython基础

IPython Shell 就像个强化版的 shell,许多Python对象被格式化为更易读的形式 。

In [1]:import numpy as np

In [2]:data = {i:np.random.randon() for i in range(7)}
In [3]:data

Out[4]: 
{0: 1.1262296868416168,
 1: 0.4902051898746383,
 2: -0.027009478666721817,
 3: 0.8771881765876961,
 4: -0.2811179666598623,
 5: -1.3457828447782272,
 6: 2.352335147499731}

IPython还支持执行任意代码块(通过一个华丽的复制-粘贴方法)和整段Python脚本的功能。你也可以使用Jupyter notebook运行大代码块,接下来就会看到。

2.3 运行Jupyter Notebook

notebook是Jupyter项目的重要组件之一,它是一个代码、文本(有标记或无标记)、数据可视化或其它输出的交互式文档。Jupyter Notebook需要与内核互动,内核是Jupyter与其它编程语言的交互编程协议。Python的Jupyter内核是使用IPython。要启动Jupyter,在命令行中输入jupyter notebook:

魔术命令

IPython中特殊的命令(Python中没有)被称作“魔术”命令。这些命令可以使普通任务更便捷,更容易控制IPython系统。魔术命令是在指令前添加百分号%前缀。例如,可以用%timeit(这个命令后面会详谈)测量任何Python语句,例如矩阵乘法的执行时间:


In [6]: a = np.random.randn(100,100)

In [7]: %timeit np.dot(a,a)
60.3 µs ± 7.65 µs per loop (mean ± std. dev. of 7 runs, 1 loop each)

IPython and Jupyter

感兴趣的可以去翻阅一下,这里就不做详细介绍了。

上一篇下一篇

猜你喜欢

热点阅读