常用numpy的random模块

2019-01-11 本文已影响0人 AWRL

本文为个人学习总结，如有不当之处，还望留言

我们经常在数据分析、数据挖掘、机器学习等场景要使用到随机数，也因为np.random模块功能太多，所以在这里把常见的几个做个简单的汇总。

首先没有numpy的童鞋需先安装

pip install numpy

然后导包

import numpy as np

1、np.random.rand(d0, d1, ..., dn)

作用：生成[0, 1)之间的指定形状的随机浮点数
参数：d0, d1, ..., dn，int类型，如不写则返回单个随机数
返回：ndarray类型，形状（d0, d1, ..., dn）

>>> np.random.rand() # 没有参数则直接生成一个[0,1)区间的随机数
0.1065982531337718
>>> np.random.rand(3) # 只有一个参数则生成n*1个随机数
array([0.24640203, 0.81910232, 0.79941588])
>>> np.random.rand(2, 3, 4) # 有多个参数，则生成对应形状随机数，如本例生成shape为2*3*4的随机数
array([[[0.73222489, 0.80656115, 0.65878337, 0.69227656],
        [0.84919565, 0.24966801, 0.48942496, 0.22120944],
        [0.98766801, 0.94405934, 0.03942681, 0.70557517]],

       [[0.92524832, 0.18057535, 0.56794523, 0.9154883 ],
        [0.03394598, 0.69742027, 0.29734901, 0.9243962 ],
        [0.97105825, 0.94426649, 0.47421422, 0.86204265]]])

2、np.random.randn(d0, d1, ..., dn)

作用：生成指定形状,服从标准正态分布（均值为0，标准差为1）的随机数
参数：d0, d1, ..., dn，int型，如不写则返回单个标准正态分布实例
返回：ndarray类型，形状（d0, d1, ..., dn）

>>> np.random.randn() # 没有参数则直接随机生成一个标准正态分布实例
0.4125703966441225
>>> np.random.randn(3) # 只有一个参数则生成n*1的服从标准正态分布的随机数
array([-1.9296846 , -0.65058484,  1.04354591])
>>> np.random.randn(2, 3, 4) # 有多个参数，则生成对应形状标准正态分布随机数，如本例生成shape为2*3*4的服从标准正态分布的随机数
array([[[ 0.86776502,  0.28303221, -1.34946357,  0.58550346],
        [ 0.71339959,  0.04701721,  1.22317095, -0.68343179],
        [-0.50985758, -2.48461158,  0.91982751,  0.31386196]],

       [[-1.68182033, -1.758599  , -0.87263063,  0.79365794],
        [-0.30036049, -0.80478692, -1.00611589, -1.05091196],
        [-1.9336783 , -1.20739583, -1.07057808,  0.68262324]]])

3、np.random.randint(low, high=None, size=None, dtype='l')

作用：生成指定区间[low, high)的随机整数
参数：
-- low: 最小值，int型
-- high: 最大值，int型
-- size: 数组维度，int型或由int构成的tuple型
-- dtype: 数据类型，默认为np.int
返回：int型或者由int构成的ndarray

>>> np.random.randint(5) # 只有一个参数，默认生成一个[0, 5)的随机整数
3
>>> np.random.randint(2, 5) # 两个参数，生成一个在[2, 5)的随机整数
4
>>> np.random.randint(3, size=5) # 生成5个[0, 3)的随机整数
array([1, 0, 1, 2, 2])
>>> np.random.randint(-3, 5, size=(3, 4)) # 在[-3, 5)区间上，生成shape为3*4的随机整数
array([[ 3,  1, -1, -3],
       [ 2,  3,  3,  4],
       [-1, -1, -2,  3]])

4、np.random.random_integers(low, high=None, size=None)

作用：生成指定区间[low, high]的随机整数
参数：同randint
返回：同randint
说明：用法和randint相似，系统弃用警告，建议使用randint
-- 不同之处：全闭区间；只有一个参数时，区间为[1, low]

DeprecationWarning: This function is deprecated. Please call randint() instead

>>> np.random.rand_integers(2) # 生成[1,2]区间的一个随机数
1

5、np.random.random(size=None)

作用：生成[0,1)区间指定size的随机浮点数
参数：size，数组维度，int型或由int构成的tuple型
返回：float型或由float构成的ndarray型

>>> np.random.random() # 没有参数，直接生成一个[0, 1)区间随机浮点数
0.15893828327675652
>>> np.random.random(3) # 一个参数，生成[0, 1)区间shape为3*1的随机浮点数
array([0.77282278, 0.23005368, 0.13133513])
>>> np.random.random(size=(3, 4)) # tuple型参数，生成[0, 1)区间shape为3*4的随机浮点数
array([[0.86805432, 0.96323665, 0.03130231, 0.73127007],
       [0.90952451, 0.85736009, 0.96452047, 0.76009408],
       [0.44229876, 0.31195199, 0.32074274, 0.72442267]])

6、np.random.choice(a, size=None, replace=True, p=None)

作用：从给定的一维数组中生成随机数
参数：
-- a: 一维数组或int型
-- size: 数组维度，int型或由int构成的tuple型
-- replace: 布尔型，False时生成的随机数无重复
-- p: 为a的数据设置概率，不设置时默认为均匀分布
返回：单个样本或多个样本构成的ndarray类型

>>> np.random.choice([1, 3, 5, 7]) # 只有一个参数a,从a中随机选一个
7
>>> np.random.choice([1, 3, 5, 7], size=2) # 指定size，从a中随机选2个
array([1, 7])
>>> np.random.choice([1, 3, 5, 7], size=(2, 3)) # size为tuple，从a中随机选2*3个
array([[5, 3, 3],
       [1, 1, 3]])
>>> np.random.choice([1, 2, 3, 4, 5, 6, 7, 8, 9], size=(2, 3), replace=False) # replace设置为false时，生成的随机数不重复
array([[7, 2, 6],
       [4, 1, 5]])
>>> np.random.choice([1, 2, 3, 4], size=2, p=(0.1, 0.2, 0.3, 0.4)) # 设置p，根据p的权重随机挑选
array([4, 4])

7、np.random.permutation(x)

作用：随机打乱数据序列
参数：x，int型或array型
返回：ndarray,一个打乱后的数据

>>> np.random.permutation(4) # 一个整数，把[0, 4)的整数打乱顺序
array([2, 1, 3, 0])
>>> np.random.permutation([1, 3, 5, 7, 9, 11]) # 一维数组，打乱一维数组顺序
array([ 5,  3, 11,  9,  7,  1])
>>> x = np.arange(9).reshape((3, 3))
>>> x =
array([[0, 1, 2],
       [3, 4, 5],
       [6, 7, 8]])
>>> np.random.permutation(x) # 多维数组，打乱多维数组的顺序
array([[6, 7, 8],
       [3, 4, 5],
       [0, 1, 2]])

8、np.random.seed(seed=None)

作用：初始化伪随机数发生器（生成的随机数下次还要用，则可用随机数种子）
参数：seed，int型或一维array型

>>> for i in range(5):
>>>     print(np.random.rand(3)) 
[0.0675444  0.73276212 0.60205068]
[0.38711645 0.81037221 0.95704267]
[0.74261574 0.30360743 0.64652647]
[0.18686297 0.54379681 0.45931029]
[0.60036382 0.76657129 0.98785048]
# 我们可以看到当不加随机数种子时生成的5次随机数都不一样
>>> for i in range(5):
>>>     np.random.seed(42) # 参数42，个人理解为42空间
>>>     print(np.random.rand(3))
[0.37454012 0.95071431 0.73199394]
[0.37454012 0.95071431 0.73199394]
[0.37454012 0.95071431 0.73199394]
[0.37454012 0.95071431 0.73199394]
[0.37454012 0.95071431 0.73199394]
# 当添加随机数种子，5次随机生成的数都一样

更多详细用法可以参照官方文档：https://www.numpy.org/devdocs/reference/routines.random.html

常用numpy的random模块

本文为个人学习总结，如有不当之处，还望留言

1、np.random.rand(d0, d1, ..., dn)

2、np.random.randn(d0, d1, ..., dn)

3、np.random.randint(low, high=None, size=None, dtype='l')

4、np.random.random_integers(low, high=None, size=None)

5、np.random.random(size=None)

6、np.random.choice(a, size=None, replace=True, p=None)

7、np.random.permutation(x)

8、np.random.seed(seed=None)

结语：以上为本人对常用random模块的小结，希望能帮到大家。

猜你喜欢

热点阅读