numpy 笔记

2018-04-15 本文已影响0人薛东弗斯

Numpy是什么

Numpy(Numerical Python)是一个开源的Python科学计算库，包含很多实用的数学函数，线性代数运算，傅里叶变换等

现在用python搞数据分析或机器学习经常使用的pandas、matplotlib、sklearn等库，都需要基于numpy构建

Numpy beginner's guide.png

Numpy能够直接对数组和矩阵进行操作，运算效率优于Python提供的list容器

** Numpy模块里的函数帮助请求**

Paste_Image.png

importnumpyasnp#help()help(np.arange)#?方法# np.arange?

数组对象

Numpy数组一般是同质的，即数组中的所有元素类型必须是一致的

Numpy数组下标也是从0开始的

ndarray是numpy的核心数据结构。ndarray如何在内存中储存的：关于数组的描述信息保存在一个数据结构中，这个结构引用两个对象，一块用于保存数据的存储区域和一个用于描述元素类型的dtype对象

关于ndarray的索引方式，有以下几个重点需要记住：

虽然x[0,2] = x0，但是前者效率比后者高，因为后者在应用第一个索引后需要先创建一个temporary array，然后再应用第二个索引，最后找到目标值。

分片操作不会引发copy操作，而是创建原ndarray的view；他们所指向的内存是同一片区域，无论是修改原ndarray还是修改view，都会同时改变二者的值。

index array和boolean index返回的是copy，不是view。

** 部分函数操作**

改变数组维度

Paste_Image.png

importnumpyasnp b = np.arange(24).reshape(2,3,4)#ravel展平数组的操作b.ravel()#array([ 0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16,17,18,19,20,21,22,23])'''

flatten也是展平操作，与ravel功能相同，

差异在于flatten会请求分配内存保存结果，

而ravel只是返回一下view

'''b.flatten()#reshape用一正整数元组设置数组的维度b.reshape(4,6)#resize 与reshape功能一样，resize会直接修改所操作的数组b.resize((2,12))b#transpose转置矩阵b.transpose()

数组的组合

Numpy数组有水平组合，垂直组合和深度组合等多种组合方式：vstack, dstack, hstack, column_stack, row_stack及concatenate函数。

ndarray_stack.png

importnumpyasnpa = np.arange(9).reshape(3,3)b =2*a'''

a = [[0 1 2]

[3 4 5]

[6 7 8]]

b = [[ 0 2 4]

[ 6 8 10]

[12 14 16]]

'''#水平组合，与np.concatenate((a,b), axis=1)功能相同np.hstack((a,b))# array([[ 0, 1, 2, 0, 2, 4],[3,4,5,6,8,10], [6,7,8,12,14,16]])#垂直组合，与np.concatenate((a,b), axis=0)相同np.vstack((a, b))# array([[ 0, 1, 2],[3,4,5], [6,7,8], [0,2,4], [6,8,10], [12,14,16]])# 深度组合，将一系统数组沿着纵轴方向进度层叠组合np.dstack((a, b))# array([[[ 0, 0],[1,2], [2,4]], [[3,6], [4,8], [5,10]], [[6,12], [7,14], [8,16]]])#列组合，与hstack效果相同np.column_stack((a, b))#行组合，与vstack效果相同的np.row_stack((a, b))

*数组的分割

Numpy可以对数组进行水平，垂直或深度分割：hsplit, vsplit, dsplit和split，可将数组分割成相同大小的子数组，也可指定原数组中需要分割的位置

Paste_Image.png

#水平分割，与np.split(a, 3, axis=1)相同np.hsplit(a, 3)#垂直分割，与np.split(a, 3, axis=0)相同np.vsplit(a, 3)#深度分割，按深度方向分割数组c = np.arange(27).reshape(3,3,3)np.dsplit(c, 3)

数组的属性

Paste_Image.png

shape，数组的形状

dtype，数据类型

ndim，维数或数组轴的个数

size，数组元素总个数

itemsize，数组元素在内存中所占的字节数

nbytes，整个数组所占的存储空间

T，转置，与transpose一样

在numpy中，复数的虚部是用j来表示的

在复数中：real属性，imag属性分别取得数组的实部与虚部

flat，将返回一个numpy.flatiter对象，可遍历

数组的转换

tolist：将Numpy数组转换成Python列表

astype：可在转换数组时指定数据类型

Numpy读写文件

#写：函数将数据a存储到test.txt文件中np.savetxt('test.txt', a)'''

读

表示读取test.csv文件，分隔符设置

为‘，’（delimiter=','），usecols表示

取得哪几列数据，unpack=True表示分

拆存储不同列的数据，即分别将第6列与

第7列数据赋值给变量x,y

'''x, y = np.loadtxt('test.csv', delimiter=',', usecols=(6,7), unpack=True)

数据分析常用的函数

#加权平均，v作为权重参数np.average(c, weights=v)#算术平均np.mean(c)#取值范围np.max(c)np.min(c)#ptp函数返回最大值与最小值之间的差值np.ptp(c)#median函数返回中位数np.median(c)#var方差np.var(c)#diff函数返回一个由相邻数组元素的差值构成的数组np.diff(c)#std函数计算标准差np.std(c)#where函数根据指定的条件返回所有满足条件的数组元素的索引值idx = np.where(c>6)# take函数按照索引值从数组中取出相应的元素,np.take(c,np.where(c>6))data = np.take(idx)#argmin返回是c数组中最小元素的索引值，argmax返回最大值索引值np.argmin(c)np.argmax(c)#maximum函数可返回多个数组里的各最大值np.maximum(a, b, c)#同理minximum返回最小值#exp函数可计算每个数组元素的指数np.exp(x)#linspace(s, e, [n])函数起始s, 终止e，个数n(可选)，返回一个元素值在指定的范围内均匀分布的数组np.linspace(-1,0,5)#fill函数，将数组元素的值全部设置为一个指定的标量值

数组修剪和压缩

#clip方法将所有比给定最大值还大的#元素全部设为给定的最大值，而所有#比给定最小值还小的元素全部设定为给定的最小值a = np.arange(5)a.clip(1,2)#compress方法返回一个根据给定条件筛选后的数组a = np.arange(4)a.compress(a>2)#[3]

阶乘

#prod计算数组中所有元素的乘积b = np.arange(1, 9)print("b =", b)print("Factorial", b.prod())#b = [1 2 3 4 5 6 7 8]#Factorial 40320#cumprod方法，计算数组元素的累积乘积b.cumprod()#[ 1 2 6 24 120 720 5040 40320]

相关性

#协方差，描述两个变量共同变化趋势c = np.cov(a,b)#diagonal返回对角线上的元素c.diagonal()#trace计算矩阵的迹，即对角线上元素之和c.trace()#corrcoef函数计算相关系数（或者更精确地，相关系数矩阵）np.corrcoef(a, b)

判断数组里数据正负性

Paste_Image.png

#sign函数可以返回数组中每个元素的正负符号，#数组元素为负时返回-1，为正时返回1，否则返回0np.sign(c)#piecewise函数来获取数组元素的正负。piecewise函数可以分段给定取值np.piecewise(c,[c>0, c<0],[-1,1])

‘’乘与dot函数*

NumPy中的乘法运算符 *指示按元素计算，矩阵乘法可以使用 dot函数

importnumpyasnpa = np.arange(6).reshape(2,3)'''

[[0 1 2]

[3 4 5]]

'''b = np.arange(-3,3).reshape(2,3)'''

[[-3 -2 -1]

[ 0 1 2]]

'''bb = b.reshape(3,2)'''

[[-3 -2]

[-1 0]

[ 1 2]]

'''ab = a * bprint('a*b result is ', ab)'''

[

[ 0 -2 -2]

[ 0 4 10]

]

'''a_bb = np.dot(a, bb)print('a.*b result is ', a_bb)'''

[

[ 1 4]

[-8 4]

]

'''

其他函数

trim_zeros：去掉一维数组中开头和末尾为0的元素

其它函数array, zeros, zeros_like, ones, ones_like, empty, empty_like, arange, linspace, rand, randn, fromfunction, fromfile参考：NumPy示例

作者：深思海数_willschang

链接：https://www.jianshu.com/p/81501a85d406

來源：简书

著作权归作者所有。商业转载请联系作者获得授权，非商业转载请注明出处。

numpy 笔记

猜你喜欢

热点阅读