Numpy
Numpy是python科学计算的基础包,它提供的功能有:
1、快速高效的多维数组对象ndarry
2、用于数组执行元素级计算以及直接对数组执行数学运算的函数
3、用于读写硬盘上基于数组的数据集工具
4、线性代数运算、傅里叶变换,以及随机数生成
5、用于将C、C++、Fortran代码集成到Python的工具
ndarry:一种多维数组对象
该对象是一个快速而灵活的大数据集容器。
创建ndarry
创建数组的最简单的办法是使用array函数
import numpy as np
data1=[1,5,5,88,222,986]
arr1=np.array(data1)#转化为数组
type(arr1) #查看数据类型
numpy.ndarray
嵌套序列(比如由一组等长列表组成的列表)将会被转换为一个多维数组
data2=[[1,2,3,4],[5,6,7,8]]
arr2=np.array(data2)
arr2
array([[1, 2, 3, 4],
[5, 6, 7, 8]])
arr2.ndim#查看对象的维度
2
arr2.shape#差不多是查看几行几列吧
(2, 4)
除此之外,zeros和ones分别可以 创建制定长度或形状的全0或全1数组,empty可以创造一个没有任何具体值的数组。
np.zeros(11)
array([0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0.])
np.zeros((4,4))
array([[0., 0., 0., 0.],
[0., 0., 0., 0.],
[0., 0., 0., 0.],
[0., 0., 0., 0.]])
np.ones((2,3))
array([[1., 1., 1.],
[1., 1., 1.]])
np.empty((2,2,3))
array([[[1.11271608e-311, 2.47032823e-322, 0.00000000e+000],
[0.00000000e+000, 1.37961641e-306, 2.42336543e-057]],
[[5.58049447e-091, 1.16065910e-046, 2.38140024e+179],
[6.86888915e+169, 3.99910963e+252, 2.56765132e-312]]])
#一般情况下,np.empty返回的都是未初始化的垃圾值
arrange是Python内置函数range的数组版
np.arange(15)
array([ 0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14])
数组创建函数
函数 说明
array 将输入数据转维护ndarry
asarray 将输入转换为ndarray,如果输入本身就是一个ndarry就不进行复制
arange 类似于内置的range,但返回的是ndarry而不是列表
ones、one_likes 根据指定的形状和dtype创建一个全1数组。one_likes以另一个数组为参数,并根据其形状和的dtype创建一个全一数组。
zeros、zeros_like 类似于ones、ones_like,只不过产生的是全0数组
empty、empty_like 创建新数组,只分配内存空间但不填充任何值
eye、identity 创建一个正方的N*N单位矩阵
ndarry的数据类型
dtype是一个特殊的对象,它含有ndarry将一块内存解释为特定数据类型所需的信息
dtype是Numpy如此强大的原因之一。
数组和标量之间的运算
数组很重要,因为它使你不用编写即可对数据进行批量运算。这个也叫做 矢量化
不同大小的数组之间的运算叫做广播
基本的索引和切片
首先我们来讲一讲切片索引
这个非常容易混淆,,,,请细心观看
arr[:2,1:]的意思是在第二行之前,第一列之后的,也就是我们数学中的第一二行和第二三列交叉的地方。(注意,python中的行从零开始计数,列是从1开始技术)目前自己是这么理解的
利用数组进行数据处理
这段代码中的函数是可用来画等高线,具体应用在支持向量机中可见
points=np.arange(-5,5,0.01)#1000个间隔相等的点
xs,ys=np.meshgrid(points,points)#这个函数的意思是 接受两个一维数组,并产生两个二维矩阵
ys
Out[29]: #这个其实就是把ys转置成列,然后每行输入(x的个数个 )对不起,我表达不出来,看到的人将就看
array([[-5. , -5. , -5. , ..., -5. , -5. , -5. ],
[-4.99, -4.99, -4.99, ..., -4.99, -4.99, -4.99],
[-4.98, -4.98, -4.98, ..., -4.98, -4.98, -4.98],
...,
[ 4.97, 4.97, 4.97, ..., 4.97, 4.97, 4.97],
[ 4.98, 4.98, 4.98, ..., 4.98, 4.98, 4.98],
[ 4.99, 4.99, 4.99, ..., 4.99, 4.99, 4.99]])
xs
Out[33]:
array([[-5. , -4.99, -4.98, ..., 4.97, 4.98, 4.99],
[-5. , -4.99, -4.98, ..., 4.97, 4.98, 4.99],
[-5. , -4.99, -4.98, ..., 4.97, 4.98, 4.99],
...,
[-5. , -4.99, -4.98, ..., 4.97, 4.98, 4.99],
[-5. , -4.99, -4.98, ..., 4.97, 4.98, 4.99],
[-5. , -4.99, -4.98, ..., 4.97, 4.98, 4.99]])
将条件逻辑表述为数组运算
numpy.where函数是三元表达式x if condition else y的矢量化版本
xarr=np.array([1.1,1.2,1.3,1.4,1.5])
yarr=np.array([2.1,2.2,2.3,2.4,2.5])
cond=np.array([True,False,True,True,False])
result=np.where(cond,xarr,yarr)
result
Out[34]: array([1.1, 2.2, 1.3, 1.4, 2.5])
result1=[(x if c else y)
for x,y,c in zip(xarr,yarr,cond)]
result1
Out[35]: [1.1, 2.2, 1.3, 1.4, 2.5]