常用numpy的random模块
2019-01-11 本文已影响0人
AWRL
本文为个人学习总结,如有不当之处,还望留言
我们经常在数据分析、数据挖掘、机器学习等场景要使用到随机数,也因为np.random模块功能太多,所以在这里把常见的几个做个简单的汇总。
首先没有numpy的童鞋需先安装
pip install numpy
然后导包
import numpy as np
1、np.random.rand(d0, d1, ..., dn)
- 作用:生成[0, 1)之间的指定形状的随机浮点数
- 参数:d0, d1, ..., dn,int类型,如不写则返回单个随机数
- 返回:ndarray类型,形状(d0, d1, ..., dn)
>>> np.random.rand() # 没有参数则直接生成一个[0,1)区间的随机数
0.1065982531337718
>>> np.random.rand(3) # 只有一个参数则生成n*1个随机数
array([0.24640203, 0.81910232, 0.79941588])
>>> np.random.rand(2, 3, 4) # 有多个参数,则生成对应形状随机数,如本例生成shape为2*3*4的随机数
array([[[0.73222489, 0.80656115, 0.65878337, 0.69227656],
[0.84919565, 0.24966801, 0.48942496, 0.22120944],
[0.98766801, 0.94405934, 0.03942681, 0.70557517]],
[[0.92524832, 0.18057535, 0.56794523, 0.9154883 ],
[0.03394598, 0.69742027, 0.29734901, 0.9243962 ],
[0.97105825, 0.94426649, 0.47421422, 0.86204265]]])
2、np.random.randn(d0, d1, ..., dn)
- 作用:生成指定形状,服从标准正态分布(均值为0,标准差为1)的随机数
- 参数:d0, d1, ..., dn,int型,如不写则返回单个标准正态分布实例
- 返回:ndarray类型,形状(d0, d1, ..., dn)
>>> np.random.randn() # 没有参数则直接随机生成一个标准正态分布实例
0.4125703966441225
>>> np.random.randn(3) # 只有一个参数则生成n*1的服从标准正态分布的随机数
array([-1.9296846 , -0.65058484, 1.04354591])
>>> np.random.randn(2, 3, 4) # 有多个参数,则生成对应形状标准正态分布随机数,如本例生成shape为2*3*4的服从标准正态分布的随机数
array([[[ 0.86776502, 0.28303221, -1.34946357, 0.58550346],
[ 0.71339959, 0.04701721, 1.22317095, -0.68343179],
[-0.50985758, -2.48461158, 0.91982751, 0.31386196]],
[[-1.68182033, -1.758599 , -0.87263063, 0.79365794],
[-0.30036049, -0.80478692, -1.00611589, -1.05091196],
[-1.9336783 , -1.20739583, -1.07057808, 0.68262324]]])
3、np.random.randint(low, high=None, size=None, dtype='l')
- 作用:生成指定区间[low, high)的随机整数
- 参数:
-- low: 最小值,int型
-- high: 最大值,int型
-- size: 数组维度,int型或由int构成的tuple型
-- dtype: 数据类型,默认为np.int - 返回:int型或者由int构成的ndarray
>>> np.random.randint(5) # 只有一个参数,默认生成一个[0, 5)的随机整数
3
>>> np.random.randint(2, 5) # 两个参数,生成一个在[2, 5)的随机整数
4
>>> np.random.randint(3, size=5) # 生成5个[0, 3)的随机整数
array([1, 0, 1, 2, 2])
>>> np.random.randint(-3, 5, size=(3, 4)) # 在[-3, 5)区间上,生成shape为3*4的随机整数
array([[ 3, 1, -1, -3],
[ 2, 3, 3, 4],
[-1, -1, -2, 3]])
4、np.random.random_integers(low, high=None, size=None)
- 作用:生成指定区间[low, high]的随机整数
- 参数:同randint
- 返回:同randint
- 说明:用法和randint相似,系统弃用警告,建议使用randint
-- 不同之处:全闭区间;只有一个参数时,区间为[1, low]
DeprecationWarning: This function is deprecated. Please call randint() instead
>>> np.random.rand_integers(2) # 生成[1,2]区间的一个随机数
1
5、np.random.random(size=None)
- 作用:生成[0,1)区间指定size的随机浮点数
- 参数:size,数组维度,int型或由int构成的tuple型
- 返回:float型或由float构成的ndarray型
>>> np.random.random() # 没有参数,直接生成一个[0, 1)区间随机浮点数
0.15893828327675652
>>> np.random.random(3) # 一个参数,生成[0, 1)区间shape为3*1的随机浮点数
array([0.77282278, 0.23005368, 0.13133513])
>>> np.random.random(size=(3, 4)) # tuple型参数,生成[0, 1)区间shape为3*4的随机浮点数
array([[0.86805432, 0.96323665, 0.03130231, 0.73127007],
[0.90952451, 0.85736009, 0.96452047, 0.76009408],
[0.44229876, 0.31195199, 0.32074274, 0.72442267]])
6、np.random.choice(a, size=None, replace=True, p=None)
- 作用:从给定的一维数组中生成随机数
- 参数:
-- a: 一维数组或int型
-- size: 数组维度,int型或由int构成的tuple型
-- replace: 布尔型,False时生成的随机数无重复
-- p: 为a的数据设置概率,不设置时默认为均匀分布 - 返回:单个样本或多个样本构成的ndarray类型
>>> np.random.choice([1, 3, 5, 7]) # 只有一个参数a,从a中随机选一个
7
>>> np.random.choice([1, 3, 5, 7], size=2) # 指定size,从a中随机选2个
array([1, 7])
>>> np.random.choice([1, 3, 5, 7], size=(2, 3)) # size为tuple,从a中随机选2*3个
array([[5, 3, 3],
[1, 1, 3]])
>>> np.random.choice([1, 2, 3, 4, 5, 6, 7, 8, 9], size=(2, 3), replace=False) # replace设置为false时,生成的随机数不重复
array([[7, 2, 6],
[4, 1, 5]])
>>> np.random.choice([1, 2, 3, 4], size=2, p=(0.1, 0.2, 0.3, 0.4)) # 设置p,根据p的权重随机挑选
array([4, 4])
7、np.random.permutation(x)
- 作用:随机打乱数据序列
- 参数:x,int型或array型
- 返回:ndarray,一个打乱后的数据
>>> np.random.permutation(4) # 一个整数,把[0, 4)的整数打乱顺序
array([2, 1, 3, 0])
>>> np.random.permutation([1, 3, 5, 7, 9, 11]) # 一维数组,打乱一维数组顺序
array([ 5, 3, 11, 9, 7, 1])
>>> x = np.arange(9).reshape((3, 3))
>>> x =
array([[0, 1, 2],
[3, 4, 5],
[6, 7, 8]])
>>> np.random.permutation(x) # 多维数组,打乱多维数组的顺序
array([[6, 7, 8],
[3, 4, 5],
[0, 1, 2]])
8、np.random.seed(seed=None)
- 作用:初始化伪随机数发生器(生成的随机数下次还要用,则可用随机数种子)
- 参数:seed,int型或一维array型
>>> for i in range(5):
>>> print(np.random.rand(3))
[0.0675444 0.73276212 0.60205068]
[0.38711645 0.81037221 0.95704267]
[0.74261574 0.30360743 0.64652647]
[0.18686297 0.54379681 0.45931029]
[0.60036382 0.76657129 0.98785048]
# 我们可以看到当不加随机数种子时生成的5次随机数都不一样
>>> for i in range(5):
>>> np.random.seed(42) # 参数42,个人理解为42空间
>>> print(np.random.rand(3))
[0.37454012 0.95071431 0.73199394]
[0.37454012 0.95071431 0.73199394]
[0.37454012 0.95071431 0.73199394]
[0.37454012 0.95071431 0.73199394]
[0.37454012 0.95071431 0.73199394]
# 当添加随机数种子,5次随机生成的数都一样
更多详细用法可以参照官方文档:https://www.numpy.org/devdocs/reference/routines.random.html