Numpy学习笔记

2017-09-08 本文已影响143人 Mr_Puff

点积与乘法运算符

Numpy的乘法运算符*是按元素逐个运算的，与matlab不同。假设矩阵a(m,n) b(n,k)，要求a的列数与b的行数相等才可进行乘法运算。
计算规则：a(m,n)*b(n,k)=c(m,k):
matlab环境下，基本运算符按照矩阵乘法处理：

>> a=[1,2,3;2,2,4]
a =

   1   2   3
   2   2   4

>> b=[3;3;3]
b =

   3
   3
   3

>> a*b
ans =

   18
   24

使用numpy运算结果是按照矩阵的点积处理:

a = np.array([[1,2,3],[2,2,4]])
b= np.array([3,3,3])
a*b
Out[99]: 
array([[ 3,  6,  9],
       [ 6,  6, 12]])

矩阵乘法运算需要使用dot函数：

np.dot(a,b)
Out[100]: 
array([18, 24])

矩阵转置

矩阵转置把矩阵的行和列互相交换。
matlab操作命令：

>> a=[1,3,2;2,1,5;6,3,1]
a =

   1   3   2
   2   1   5
   6   3   1
>> a'
ans =

   1   2   6
   3   1   3
   2   5   1

numpy操作：

a=np.array([[1,3,2],[2,1,5],[6,3,1]])
a.T
Out[116]: 
array([[1, 2, 6],
       [3, 1, 3],
       [2, 5, 1]])

广播（broadcasting）机制

假设对矩阵X的所有列加上一个向量，基本实现思路可以是这样：

import numpy as np
x = np.array([[1,2,4],[3,2,2],[4,2,5]])
v = [1,0,1]
y = np.empty_like(x)
for i in range(3):
    y[i,:] = x[i,:]+v
y
Out[7]: 
array([[2, 2, 5],
       [4, 2, 3],
       [5, 2, 6]])

对矩阵X的每一行进行求和处理，就可以算出最终结果。除此之外，也可以用tile函数将向量按行复制成为与X具有相同shape的矩阵，然后再进行求和：

vv = np.tile(v,(3, 1))
vv
Out[10]: 
array([[1, 0, 1],
       [1, 0, 1],
       [1, 0, 1]])
x+vv
Out[11]: 
array([[2, 2, 5],
       [4, 2, 3],
       [5, 2, 6]])

但是，numpy提供的广播机制可以简化这种shape不同的数组或矩阵之间的基本运算：

x+v
Out[12]: 
array([[2, 2, 5],
       [4, 2, 3],
       [5, 2, 6]])

来看一个基本的例子：

v = np.array([1,2,3])
w = np.array([4,5])
np.reshape(v,(3,1))
Out[15]: 
array([[1],
       [2],
       [3]])
np.reshape(v,(3,1))*w
Out[16]: 
array([[ 4,  5],
       [ 8, 10],
       [12, 15]])

向量v在进行reshape操作之后变成3x1的矩阵，w是一个1x2的向量，在进行点积运算时，广播机制就生效了，最终结果是一个3x2的矩阵。广播机制的两个基本原则：

广播之后，输出数组的shape是输入数组shape的各个轴上的最大值，然后沿着较大shape属性的方向复制延伸；
要进行广播机制，要么两个数组的shape属性一样，要么其中有一个数组的shape属性必须有一个等于1。
见图（来源：http://www.labri.fr/perso/nrougier/from-python-to-numpy/?utm_source=mybridge&utm_medium=blog&utm_campaign=read_more#broadcasting）：

image.png

numpy数组与矩阵

大部分情况下，numpy可以利用二维数组完成矩阵的基本操作。二者可以通过mat函数进行转换：

x = np.array([[1,2,3],[2,3,2],[4,2,5]])
y = np.mat(x)
y
Out[46]: 
matrix([[1, 2, 3],
        [2, 3, 2],
        [4, 2, 5]])

进行基本求逆运算：

x*y.I
Out[47]: 
matrix([[  1.00000000e+00,   0.00000000e+00,  -5.55111512e-17],
        [ -1.11022302e-16,   1.00000000e+00,  -2.77555756e-17],
        [  0.00000000e+00,   0.00000000e+00,   1.00000000e+00]])
x*y.I - np.eye(3)
Out[49]: 
matrix([[ -2.22044605e-16,   0.00000000e+00,  -5.55111512e-17],
        [ -1.11022302e-16,   0.00000000e+00,  -2.77555756e-17],
        [  0.00000000e+00,   0.00000000e+00,  -2.22044605e-16]])
x*y.I - (x*y.I - np.eye(3))
Out[50]: 
matrix([[ 1.,  0.,  0.],
        [ 0.,  1.,  0.],
        [ 0.,  0.,  1.]])

I属性即可取得矩阵的逆矩阵，二维数组不具有该属性。逆矩阵与自身相乘得到的结果应该是一个单位矩阵，由于计算机的运算误差，对角线以外的位置产生了很多极小的误差，因此减去一个同样shape的单位矩阵就可以得到这个误差值，将运算结果减去误差就可以得到一个标准单位矩阵。

Numpy学习笔记

点积与乘法运算符

矩阵转置

广播（broadcasting）机制

numpy数组与矩阵

猜你喜欢

热点阅读