python-3 numpy
2019-03-24 本文已影响4人
silent_eyes_77
numpy 是python科学计算的核心库,当然也涉及pandas和sklearn(基于numpy继续二次开发的包)功能很强大,和matplotlib、scripy一起相当于matlab的作用。
主要内容:
1.数组的定义和应用
2.数组元素的索引选取
3.数组的计算
4.线性代数的运行计算
1.1 Arrays
*用于存储同类型的数据(int、float、String。。)
*能够被非负整数进行索引,维度的数量就是array的秩(rank)。
*可以通过python列表创建array并且通过方括号进行索引获取元素。
import numpy as np
import pandas as pd
a=np.array([1,2,4,6,5]) #创建一维数组
b=np.array([[1,2,3,4],[5,6,7,8]]) # 创建二维数组
1.2 创建Array
numpy 提供内置函数创建一些特殊数据
np.zeros(3) #创建含有三个0元素的数组
array([0., 0., 0.])
np.ones([3,5])
array([[1., 1., 1., 1., 1.],
[1., 1., 1., 1., 1.],
[1., 1., 1., 1., 1.]])
np.zeros_like(b) #构建一个0元素组成的数组,结构同b
array([[0, 0, 0, 0],
[0, 0, 0, 0]])
1.3 数组常用操作
统计计算;
排序;
按照大小索引;
条件查找;
shape
a=np.random.rand(4) #(0,1)随机的一维数组
a=np.random.rand(2,4) # (0,1)二维四列随机的一维数组
np.sum(a) #所有数组元素求和
a.size #元素个数
np.sum(a,axis=1) # 求每一行的和 ,axis控制行列
array([2.91248016, 1.91076292])
np.sum(a,axis=0) #求每一列的和
array([1.09794586, 1.4410147 , 0.92824889, 1.35603364])
a.sum(axis=0) #另一个每一列求和的方式
np.argmax(a) # 返回a中最大元素的位置
3
a.argsort() #返回每一行的排列顺序,返回顺序索引
array([[1, 2, 0, 3],
[2, 0, 3, 1]])
np.where(a>0.5) # 返回a中>0.5的元素位置
(array([0, 0, 1, 1, 1, 1, 2, 2, 2]),
array([1, 2, 0, 1, 2, 3, 0, 1, 2]))
这里是指,0行1列,0行2列,1行0列…..的位置
np.where(a>0.5,1,0) # a中>5的元素位置,满足返回1,不满足返回-1
array([0, 0, 0, 1, 1, 1])
1.4 改变数组形状
b.ravel() # 同faltten,都是将多维数组降为一维,flatten返回一份新的数组,且对它做修改不会影响原始数组
array([2, 3, 5, 6, 7, 8])
a.reshape(2,4) #reshape,重新按照指定结构构造数组(8个元素,可以重构为2维4列)
array([[0.78793172, 0.51796296, 0.66614991, 0.94043558],
[0.31001414, 0.92305174, 0.26209898, 0.41559806]])
a.reshape(4,-1) #第二个参数位置设置为-1对时候,会自动根据第一参数(已指定)分配维度。
array([[0.78793172, 0.51796296],
[0.66614991, 0.94043558],
[0.31001414, 0.92305174],
[0.26209898, 0.41559806]])
a.reshape(2,-1)
array([[0.78793172, 0.51796296, 0.66614991, 0.94043558],
[0.31001414, 0.92305174, 0.26209898, 0.41559806]])
1.5 随机数
常用方法:
rand(a,b...) 返回(0,1)指定维度的随机数
randn(a,b,...) 返回标准正态分布的随机数 randint([low,high,size,dtype])
random([size]) 返回(0,1)之间的随机数
sample([size]) 返回(0,1)之间的随机数
choice(a,[size,replace,p]) 从指定元素中选择,产生size大小的数组。
np.random.rand(2,10) #
np.random.randint(1,10,5,'int') # 返回(1,10)的随机整数,维度上1维5列
np.random.randint(1,10,(2,5),'int') # 返回(1,10)的随机整数,维度是2维5列
array([[9, 6, 2, 9, 8],
[8, 7, 9, 9, 6]])
np.random.choice(100,(3,4)) # 在(0,100)之间随机抽取元素,产生一个3行4列的数组
array([[29, 72, 32, 11],
[52, 47, 90, 5],
[79, 10, 80, 92]])
np.random.choice([22,55,11,33,44],(3,4)) # 从指定元素(11,22,33,44,55)中随机抽取,产生一个3行4列的数组
1.6 数组的索引
a=np.array([[1,2,3,4],[2,3,4,5],[3,4,5,6]])
array([[1, 2, 3, 4],
[2, 3, 4, 5],
[3, 4, 5, 6]])
a[0:3,0:1] #0~3行,不包含3,0~1列,不包含1。选择交叉的位置元素
array([[1],
[2],
[3]])
整数索引
a[[1,2],[0,1]] #第一行,第0列:2;第2行,第1列: 4
array([2, 4])
布尔型索引
a>1
a[a>2] #返回>2的所有元素
array([3, 4, 3, 4, 5, 3, 4, 5, 6])
a>3 #返回a>3元素的布尔值,
array([[False, False, False, True],
[False, False, True, True],
[False, True, True, True]])
a[2::2,::2] # 第一参数位置:从第二行开始,每次间隔步长为2;第二参数位置:列从第0列开始,每次间隔步长为2.选择元素。
array([[3, 5]])
a[1::2,::1] # 相当于选择第一行所有元素
array([[2, 3, 4, 5]])
np.random.randint(0,55,[6,6])
array([[29, 53, 53, 5, 42, 22],
[52, 39, 21, 21, 3, 31],
[35, 49, 43, 44, 26, 11],
[43, 31, 54, 50, 5, 22],
[29, 31, 26, 20, 37, 5],
[20, 12, 33, 19, 10, 23]])
1.7 数组数学
元素计算,并不是矩阵计算
a=np.random.randn(3,4)
a/2
b=np.random.randn(3,4)
a+b
array([[ 1.04139689, 0.58922263, -1.38069406, -0.71404626],
[ 0.74035989, -0.90304504, 2.44278733, 0.76996179],
[-1.31952622, 1.01089772, -1.29547704, 1.71909875]])
一些常用计算:
np.mod(a,b) a除b求余
np.divide(a,b)
np.multiply(a,b)
np.subtract(a,b)
矩阵点乘:np.dot( a,b ) a结构是m * n,b结构是n*q (矩阵的运算)
np.dot(b,[1,2,3,4])
array([0.10503481, 1.68123209, 4.52536127])
np.dot(b,a.T)
array([[ 0.68075312, 0.26218424, 0.84420365],
[-1.01875496, -0.22033819, -0.54689438],
[ 0.29243031, 2.84468729, 1.5676395 ]])