Numpy汇总
2020-09-14 本文已影响0人
ThompsonHen
转载自:
https://mp.weixin.qq.com/s/TT0xR4tmhIsRQgBM501zsw
https://github.com/juliangaal/python-cheat-sheet/tree/master/NumPy
Numpy是一个用python实现的科学计算的扩展程序库,包括:
- 一个强大的N维数组对象Array
- 比较成熟的(广播)函数库
- 用于整合C/C++和Fortran代码的工具包
- 实用的线性代数、傅里叶变换和随机数生成函数。numpy和稀疏矩阵运算包scipy配合使用更加方便。
NumPy(Numeric Python)
提供了许多高级的数值编程工具,如:矩阵数据类型
、矢量处理
,以及精密的运算库
。专为进行严格的数字处理而产生。多为很多大型金融公司使用,以及核心的科学计算组织如:Lawrence Livermore,NASA用其处理一些本来使用C++,Fortran或Matlab等所做的任务。
1. 安装numpy
$ pip install numpy
或
$ conda install numpy
2. 基础
NumPy最常用的功能之一就是NumPy数组:列表和NumPy数组的最主要区别在于功能性和速度。
列表提供基本操作,但NumPy添加了FTTs
、卷积
、快速搜索
、基本统计
、线性代数
、直方图
等。
两者数据科学最重要的区别是能够用NumPy数组进行元素级计算。
2.1 占位符
操作 | 描述 | 文档 |
---|---|---|
np.linspace(0, 2, 9) | 数组中创建等差的值 | |
np.zeros((1, 2)) | 创建全0数组 | |
np.ones((1, 2)) | 创建全1数组 | |
np.random.random((5, 5)) | 创建随机数的数组 | |
np.empty((2, 2)) | 创建空数组 |
举例:
import numpy as np
# 1 dimensional
x = np.array([1,2,3])
# 2 dimensional
y = np.array([(1,2,3),(4,5,6)])
x = np.arange(3)
>>> array([0, 1, 2])
y = np.arange(3.0)
>>> array([ 0., 1., 2.])
x = np.arange(3,7)
>>> array([3, 4, 5, 6])
y = np.arange(3,7,2)
>>> array([3, 5])
2.2 数组属性
语法 | 描述 | 文档 |
---|---|---|
array.shape | 维度(行, 列) | |
len(array) | 数组长度 | |
array.ndim | 数组的维度数 | |
array.size | 数组的元素数 | |
array.dtype | 数据类型 | |
type(array) | 显示数组类型 |
3. 拷贝/排序
操作 | 描述 | 文档 |
---|---|---|
np.copy(array) | 创建数组拷贝 | |
other = array.copy() | 创建数组深拷贝 | |
array.sort() | 排序一个数组 | |
array.sort(axis=0) | 按照指定轴排序一个数组 |
举例
import numpy as np
# Sort sorts in ascending order
y = np.array([10, 9, 8, 7, 6, 5, 4, 3, 2, 1])
y.sort()
print(y)
>>> [ 1 2 3 4 5 6 7 8 9 10]
4. 数组操作例程
- 增加或减少元素
操作 | 描述 | 文档 |
---|---|---|
np.append(a, b) | 增加数据项到数组 | |
np.insert(array, 1, 2, axis) | 沿着数组0轴或1轴插入数据项 | |
np.resize((2, 4)) | 将数组调整为形状(2, 4) | |
np.delete(array, 1, axis) | 从数组里删除数据项 |
举例
import numpy as np
# Append items to array
a = np.array([(1, 2, 3),(4, 5, 6)])
b = np.append(a, [(7, 8, 9)])
print(b)
>>> [1 2 3 4 5 6 7 8 9]
# Remove index 2 from previous array
print(np.delete(b, 2))
>>> [1 2 4 5 6 7 8 9]
- 组合数组
操作 | 描述 | 文档 |
---|---|---|
np.concatenate((a, b), axis=0) | 连接2个数组,添加到末尾 | |
np.vstack((a, b)) | 按照行堆叠数组 | |
np.hstack((a, b)) | 按照列堆叠数组 |
举例
import numpy as np
a = np.array([1, 3, 5])
b = np.array([2, 4, 6])
# Stack two arrays row-wise
print(np.vstack((a,b)))
>>> [[1 3 5]
[2 4 6]]
# Stack two arrays column-wise
print(np.hstack((a,b)))
>>> [1 3 5 2 4 6]
- 分割数组
操作 | 描述 | 文档 |
---|---|---|
numpy.split() | 分割数组 | |
np.array_split(array, 3) | 将数组拆分为大小(几乎)相同的子数组 | |
numpy.hsplit(array, 3) | 在第3个索引出水平拆分数组 |
# Split array into groups of ~3
a = np.array([1, 2, 3, 4, 5, 6, 7, 8])
print(np.array_split(a, 3))
>>> [array([1, 2, 3]), array([4, 5, 6]), array([7, 8])]
- 数组形状变化
操作 | 描述 | 文档 |
---|---|---|
other = ndarray.flatten() | 平铺一个二维数组到一维数组 | |
numpy.flip() | 翻转一维数组中元素的顺序 | |
np.ndarray[::-1] | 翻转一维数组中元素的顺序 | |
reshape | 改变数组的维数 | |
squeeze | 从数组的形状中删除单维度条目 | |
expand_dims | 扩展数组维度 |
- 其他
操作 | 描述 | 文档 |
---|---|---|
array = np.transpose(other) / array.T | 数组转置 | |
inverse = np.linalg.inv(matrix) | 求矩阵的逆矩阵 |
举例
# Split array into groups of ~3
a = np.array([1, 2, 3, 4, 5, 6, 7, 8])
print(np.array_split(a, 3))
>>> [array([1, 2, 3]), array([4, 5, 6]), array([7, 8])]
- 比较
操作 | 描述 | 文档 |
---|---|---|
== | 等于 | |
!= | 不等于 | |
< | 小于 | |
> | 大于 | |
<= | 小于等于 | |
>= | 大于等于 | |
np.array_eaqual(x, y) | 数组比较 |
举例
# Using comparison operators will create boolean NumPy arrays
z = np.array([1, 2, 3, 4, 5, 6, 7, 8, 9, 10])
c = z < 6
print(c)
>>> [ True True True True True False False False False False]
- 基本的统计
操作 | 描述 | 文档 |
---|---|---|
np.mean(array) | MEAN | |
np.median | MEDIAN | |
np.corrcoef | CORRELATION COEFFICIENT | |
np.std(array) | STANDARD DEVIATION |
举例
# Statistics of an array
a = np.array([1, 1, 2, 5, 8, 10, 11, 12])
# Standard deviation
print(np.std(a))
>>> 4.2938910093294167
# Median
print(np.median(a))
>>> 6.5
- 更多
操作 | 描述 | 文档 |
---|---|---|
array.sum() | 数组求和 | |
array.min() | 数组求最小值 | |
array.max(axis=0) | 数组求最大值(沿这0轴) | |
array.cumsum(axis=0) | 指定轴求累积和 |
6. 切片和子集
操作 | 描述 | 文档 |
---|---|---|
array[i] | 索引i处的一位数组 | |
array[i, j] | 索引在[i][j]处的二维数组 | |
array[i<4] | 布尔索引 | |
array[0:3] | 选择索引为0, 1, 2 | |
array[0:2, 1] | 选择第0,1行,第1列 | |
array[:1] | 选择第0行数据项(与[0:1 , :]相同) | |
array[1:2, :] | 选择第1行 | |
array[::-1] | 反转数组 |
举例:
b = np.array([(1, 2, 3), (4, 5, 6)])
# The index *before* the comma refers to *rows*,
# the index *after* the comma refers to *columns*
print(b[0:1, 2])
>>> [3]
print(b[:len(b), 2])
>>> [3 6]
print(b[0, :])
>>> [1 2 3]
print(b[0, 2:])
>>> [3]
print(b[:, 0])
>>> [1 4]
c = np.array([(1, 2, 3), (4, 5, 6)])
d = c[1:2, 0:2]
print(d)
>>> [[4 5]]
切片举例
import numpy as np
a1 = np.arange(0, 6)
a2 = np.arange(10, 16)
a3 = np.arange(20, 26)
a4 = np.arange(30, 36)
a5 = np.arange(40, 46)
a6 = np.arange(50, 56)
a = np.vstack((a1, a2, a3, a4, a5, a6))
image.png
7.小技巧
- 布尔索引
# Index trick when working with two np-arrays
a = np.array([1,2,3,6,1,4,1])
b = np.array([5,6,7,8,3,1,2])
# Only saves a at index where b == 1
other_a = a[b == 1]
#Saves every spot in a except at index where b != 1
other_other_a = a[b != 1]
import numpy as np
x = np.array([4,6,8,1,2,6,9])
y = x > 5
print(x[y])
>>> [6 8 6 9]
# Even shorter
x = np.array([1, 2, 3, 4, 4, 35, 212, 5, 5, 6])
print(x[x < 5])
>>> [1 2 3 4 4]