Numpy

2018-05-11  本文已影响68人  陶大明

Numpy是python科学计算的基础包,它提供的功能有:
1、快速高效的多维数组对象ndarry
2、用于数组执行元素级计算以及直接对数组执行数学运算的函数
3、用于读写硬盘上基于数组的数据集工具
4、线性代数运算、傅里叶变换,以及随机数生成
5、用于将C、C++、Fortran代码集成到Python的工具

ndarry:一种多维数组对象
对象是一个快速而灵活的大数据集容器

创建ndarry
创建数组的最简单的办法是使用array函数

import numpy as np
data1=[1,5,5,88,222,986]
arr1=np.array(data1)#转化为数组
type(arr1) #查看数据类型 
numpy.ndarray

嵌套序列(比如由一组等长列表组成的列表)将会被转换为一个多维数组

data2=[[1,2,3,4],[5,6,7,8]]
arr2=np.array(data2)
arr2
array([[1, 2, 3, 4],
       [5, 6, 7, 8]])
arr2.ndim#查看对象的维度
 2
arr2.shape#差不多是查看几行几列吧
 (2, 4)

除此之外,zeros和ones分别可以 创建制定长度或形状的全0或全1数组,empty可以创造一个没有任何具体值的数组。

np.zeros(11)
array([0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0.])

np.zeros((4,4))
array([[0., 0., 0., 0.],
       [0., 0., 0., 0.],
       [0., 0., 0., 0.],
       [0., 0., 0., 0.]])

np.ones((2,3))
array([[1., 1., 1.],
       [1., 1., 1.]])

np.empty((2,2,3))
array([[[1.11271608e-311, 2.47032823e-322, 0.00000000e+000],
        [0.00000000e+000, 1.37961641e-306, 2.42336543e-057]],

       [[5.58049447e-091, 1.16065910e-046, 2.38140024e+179],
        [6.86888915e+169, 3.99910963e+252, 2.56765132e-312]]])
#一般情况下,np.empty返回的都是未初始化的垃圾值

arrange是Python内置函数range的数组版

np.arange(15)
array([ 0,  1,  2,  3,  4,  5,  6,  7,  8,  9, 10, 11, 12, 13, 14])

数组创建函数
函数 说明
array 将输入数据转维护ndarry
asarray 将输入转换为ndarray,如果输入本身就是一个ndarry就不进行复制
arange 类似于内置的range,但返回的是ndarry而不是列表
ones、one_likes 根据指定的形状和dtype创建一个全1数组。one_likes以另一个数组为参数,并根据其形状和的dtype创建一个全一数组。
zeros、zeros_like 类似于ones、ones_like,只不过产生的是全0数组
empty、empty_like 创建新数组,只分配内存空间但不填充任何值
eye、identity 创建一个正方的N*N单位矩阵


ndarry的数据类型
dtype是一个特殊的对象,它含有ndarry将一块内存解释为特定数据类型所需的信息
dtype是Numpy如此强大的原因之一。

数组和标量之间的运算
数组很重要,因为它使你不用编写即可对数据进行批量运算。这个也叫做 矢量化

不同大小的数组之间的运算叫做广播

基本的索引和切片
首先我们来讲一讲切片索引
这个非常容易混淆,,,,请细心观看
arr[:2,1:]的意思是在第二行之前,第一列之后的,也就是我们数学中的第一二行和第二三列交叉的地方。(注意,python中的行从零开始计数,列是从1开始技术)目前自己是这么理解的

利用数组进行数据处理
这段代码中的函数是可用来画等高线,具体应用在支持向量机中可见

points=np.arange(-5,5,0.01)#1000个间隔相等的点
xs,ys=np.meshgrid(points,points)#这个函数的意思是  接受两个一维数组,并产生两个二维矩阵   
ys
Out[29]: #这个其实就是把ys转置成列,然后每行输入(x的个数个 )对不起,我表达不出来,看到的人将就看
array([[-5.  , -5.  , -5.  , ..., -5.  , -5.  , -5.  ],
       [-4.99, -4.99, -4.99, ..., -4.99, -4.99, -4.99],
       [-4.98, -4.98, -4.98, ..., -4.98, -4.98, -4.98],
       ...,
       [ 4.97,  4.97,  4.97, ...,  4.97,  4.97,  4.97],
       [ 4.98,  4.98,  4.98, ...,  4.98,  4.98,  4.98],
       [ 4.99,  4.99,  4.99, ...,  4.99,  4.99,  4.99]])
xs
Out[33]: 
array([[-5.  , -4.99, -4.98, ...,  4.97,  4.98,  4.99],
       [-5.  , -4.99, -4.98, ...,  4.97,  4.98,  4.99],
       [-5.  , -4.99, -4.98, ...,  4.97,  4.98,  4.99],
       ...,
       [-5.  , -4.99, -4.98, ...,  4.97,  4.98,  4.99],
       [-5.  , -4.99, -4.98, ...,  4.97,  4.98,  4.99],
       [-5.  , -4.99, -4.98, ...,  4.97,  4.98,  4.99]])

将条件逻辑表述为数组运算
numpy.where函数是三元表达式x if condition else y的矢量化版本

xarr=np.array([1.1,1.2,1.3,1.4,1.5])
yarr=np.array([2.1,2.2,2.3,2.4,2.5])
cond=np.array([True,False,True,True,False])
result=np.where(cond,xarr,yarr)
result
Out[34]: array([1.1, 2.2, 1.3, 1.4, 2.5])

result1=[(x if c else y)
          for x,y,c in zip(xarr,yarr,cond)]
result1
Out[35]: [1.1, 2.2, 1.3, 1.4, 2.5]
上一篇下一篇

猜你喜欢

热点阅读