numpy 笔记

2018-04-15  本文已影响0人  薛东弗斯

Numpy是什么

Numpy(Numerical Python)是一个开源的Python科学计算库,包含很多实用的数学函数,线性代数运算,傅里叶变换等

现在用python搞数据分析或机器学习经常使用的pandas、matplotlib、sklearn等库,都需要基于numpy构建

Numpy beginner's guide.png

Numpy能够直接对数组和矩阵进行操作,运算效率优于Python提供的list容器

** Numpy模块里的函数帮助请求**

Paste_Image.png

importnumpyasnp#help()help(np.arange)#?方法# np.arange?

数组对象

Numpy数组一般是同质的,即数组中的所有元素类型必须是一致的

Numpy数组下标也是从0开始的

ndarray是numpy的核心数据结构。ndarray如何在内存中储存的:关于数组的描述信息保存在一个数据结构中,这个结构引用两个对象,一块用于保存数据的存储区域和一个用于描述元素类型的dtype对象

关于ndarray的索引方式,有以下几个重点需要记住:

虽然x[0,2] = x0,但是前者效率比后者高,因为后者在应用第一个索引后需要先创建一个temporary array,然后再应用第二个索引,最后找到目标值。

分片操作不会引发copy操作,而是创建原ndarray的view;他们所指向的内存是同一片区域,无论是修改原ndarray还是修改view,都会同时改变二者的值。

index array和boolean index返回的是copy,不是view。

** 部分函数操作**

改变数组维度

Paste_Image.png

importnumpyasnp b = np.arange(24).reshape(2,3,4)#ravel展平数组的操作b.ravel()#array([ 0,  1,  2,  3,  4,  5,  6,  7,  8,  9, 10, 11, 12, 13, 14, 15, 16,17,18,19,20,21,22,23])'''

flatten也是展平操作,与ravel功能相同,

差异在于flatten会请求分配内存保存结果,

而ravel只是返回一下view

'''b.flatten()#reshape用一正整数元组设置数组的维度b.reshape(4,6)#resize 与reshape功能一样,resize会直接修改所操作的数组b.resize((2,12))b#transpose转置矩阵b.transpose()

数组的组合

Numpy数组有水平组合,垂直组合和深度组合等多种组合方式:vstack, dstack, hstack, column_stack, row_stack及concatenate函数。

ndarray_stack.png

importnumpyasnpa = np.arange(9).reshape(3,3)b =2*a'''

a =  [[0 1 2]

[3 4 5]

[6 7 8]]

b =  [[ 0  2  4]

[ 6  8 10]

[12 14 16]]

'''#水平组合,与np.concatenate((a,b), axis=1)功能相同np.hstack((a,b))# array([[ 0,  1,  2,  0,  2,  4],[3,4,5,6,8,10],      [6,7,8,12,14,16]])#垂直组合,与np.concatenate((a,b), axis=0)相同np.vstack((a, b))# array([[ 0,  1,  2],[3,4,5],      [6,7,8],      [0,2,4],      [6,8,10],      [12,14,16]])# 深度组合,将一系统数组沿着纵轴方向进度层叠组合np.dstack((a, b))# array([[[ 0,  0],[1,2],        [2,4]],      [[3,6],        [4,8],        [5,10]],      [[6,12],        [7,14],        [8,16]]])#列组合, 与hstack效果相同np.column_stack((a, b))#行组合,与vstack效果相同的np.row_stack((a, b))

*数组的分割

Numpy可以对数组进行水平,垂直或深度分割:hsplit, vsplit, dsplit和split,可将数组分割成相同大小的子数组,也可指定原数组中需要分割的位置

Paste_Image.png

#水平分割,与np.split(a, 3, axis=1)相同np.hsplit(a, 3)#垂直分割,与np.split(a, 3, axis=0)相同np.vsplit(a, 3)#深度分割,按深度方向分割数组c = np.arange(27).reshape(3,3,3)np.dsplit(c, 3)

数组的属性

Paste_Image.png

shape,数组的形状

dtype,数据类型

ndim,维数或数组轴的个数

size,数组元素总个数

itemsize,数组元素在内存中所占的字节数

nbytes,整个数组所占的存储空间

T,转置,与transpose一样

在numpy中,复数的虚部是用j来表示的

在复数中:real属性,imag属性分别取得数组的实部与虚部

flat,将返回一个numpy.flatiter对象,可遍历

数组的转换

tolist:将Numpy数组转换成Python列表

astype:可在转换数组时指定数据类型

Numpy读写文件

#写:函数将数据a存储到test.txt文件中np.savetxt('test.txt', a)'''

表示读取test.csv文件,分隔符设置

为‘,’(delimiter=','),usecols表示

取得哪几列数据,unpack=True表示分

拆存储不同列的数据,即分别将第6列与

第7列数据赋值给变量x,y

'''x, y = np.loadtxt('test.csv', delimiter=',', usecols=(6,7), unpack=True)

数据分析常用的函数

#加权平均,v作为权重参数np.average(c, weights=v)#算术平均np.mean(c)#取值范围np.max(c)np.min(c)#ptp函数返回最大值与最小值之间的差值np.ptp(c)#median函数返回中位数np.median(c)#var方差np.var(c)#diff函数返回一个由相邻数组元素的差值构成的数组np.diff(c)#std函数计算标准差np.std(c)#where函数根据指定的条件返回所有满足条件的数组元素的索引值idx = np.where(c>6)# take函数按照索引值从数组中取出相应的元素,np.take(c,np.where(c>6))data = np.take(idx)#argmin返回是c数组中最小元素的索引值,argmax返回最大值索引值np.argmin(c)np.argmax(c)#maximum函数可返回多个数组里的各最大值np.maximum(a, b, c)#同理minximum返回最小值#exp函数可计算每个数组元素的指数np.exp(x)#linspace(s, e, [n])函数起始s, 终止e,个数n(可选),返回一个元素值在指定的范围内均匀分布的数组np.linspace(-1,0,5)#fill函数,将数组元素的值全部设置为一个指定的标量值

数组修剪和压缩

#clip方法将所有比给定最大值还大的#元素全部设为给定的最大值,而所有#比给定最小值还小的元素全部设定为给定的最小值a = np.arange(5)a.clip(1,2)#compress方法返回一个根据给定条件筛选后的数组a = np.arange(4)a.compress(a>2)#[3]

阶乘

#prod计算数组中所有元素的乘积b = np.arange(1, 9)print("b =", b)print("Factorial", b.prod())#b = [1 2 3 4 5 6 7 8]#Factorial 40320#cumprod方法,计算数组元素的累积乘积b.cumprod()#[ 1 2 6 24 120 720 5040 40320]

相关性

#协方差,描述两个变量共同变化趋势c = np.cov(a,b)#diagonal返回对角线上的元素c.diagonal()#trace计算矩阵的迹,即对角线上元素之和c.trace()#corrcoef函数计算相关系数(或者更精确地,相关系数矩阵)np.corrcoef(a, b)

判断数组里数据正负性

Paste_Image.png

#sign函数可以返回数组中每个元素的正负符号,#数组元素为负时返回-1,为正时返回1,否则返回0np.sign(c)#piecewise函数来获取数组元素的正负。piecewise函数可以分段给定取值np.piecewise(c,[c>0, c<0],[-1,1])

‘’乘与dot函数*

NumPy中的乘法运算符 *指示按元素计算,矩阵乘法可以使用 dot函数

importnumpyasnpa = np.arange(6).reshape(2,3)'''

[[0 1 2]

[3 4 5]]

'''b = np.arange(-3,3).reshape(2,3)'''

[[-3 -2 -1]

[ 0  1  2]]

'''bb = b.reshape(3,2)'''

[[-3 -2]

[-1  0]

[ 1  2]]

'''ab = a * bprint('a*b result is ', ab)'''

[

[ 0 -2 -2]

[ 0  4 10]

]

'''a_bb = np.dot(a, bb)print('a.*b result is ', a_bb)'''

[

[ 1  4]

[-8  4]

]

'''

其他函数

trim_zeros:去掉一维数组中开头和末尾为0的元素

其它函数array, zeros, zeros_like, ones, ones_like, empty, empty_like, arange, linspace, rand, randn, fromfunction, fromfile参考:NumPy示例

作者:深思海数_willschang

链接:https://www.jianshu.com/p/81501a85d406

來源:简书

著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。

上一篇下一篇

猜你喜欢

热点阅读