《利用Python进行数据分析》-6Numpy基础
2019-07-17 本文已影响38人
皮皮大
Numpy是Python进行数值计算最重要的基础包,部分功能如下:
- 矢量算术运算和复杂的广播能力的快速
- 节省空间的多维数组
- 对整组数据进行快速运算的标准数学函数,不需要编写各种循环
- 线性代数和随机数生成以及傅里叶变化
- 数据的整理、清理、子集构造和过滤、转换
- Numpy在一个连续的内存块中存储数据,独立于Python的内置对象
- numpy数组使用的内存更少
- Numpy可以在整个数组上执行复杂的计算
import numpy as np
my_arr = np.arange(10000000)
my_list = list(range(10000000))
%time for _ in range(10): my_arr2 = my_arr * 2
Wall time: 253 ms
%time for _ in range(10): my_list2 = [x * 2 for x in my_list]
Wall time: 9.27 s
Numpy最重要的一个特点就是N维数组对象(ndarray),是一个通用的同构数据多维容器,里面的所有元素的类型必须相同
。
- shape:各个维度数组的大小
-
dtype:说明数组类型的对象
image.png
创建ndarray
- 使用array()函数,接受一切序列的对象
- zeros,ones,empty
- astype:将一个数组从dtype转换成另一个dtype;如果浮点数转换成整数,小数部分会被截除
数组运算
- 大小相同的数组之间的任何算术运算都会应用到
元素级
。 - 大小相同元素之间的比较,生成
布尔值数组
。 - 不同大小的数组的运算叫做
广播(broadcasting)