numpy.random.Generator.choice#

方法

random.Generator.choice(a, size=None, replace=True, p=None, axis=0, shuffle=True)#

从给定数组生成随机样本

参数:
a{array_like, int}

如果是一个 ndarray,则从其元素生成随机样本。如果是一个整数,则从 np.arange(a) 生成随机样本。

size{int, tuple[int]}, optional

输出形状。如果给定的形状是,例如,(m, n, k),则从一维 a 中抽取 m * n * k 个样本。如果 a 的维度多于一个,则 size 的形状将被插入到 axis 维度中,因此输出的 ndim 将是 a.ndim - 1 + len(size)。默认为 None,在这种情况下,将返回单个值。

replacebool, optional

样本是带放回还是不带放回。默认为 True,意味着 a 的一个值可以被选中多次。

p1-D array_like, optional

a 中的每个条目相关的概率。如果未给出,则样本假定在 a 的所有条目上具有均匀分布。

axisint, optional

执行选择的轴。默认为 0,按行选择。

shufflebool, optional

在不带放回地采样时,样本是否被洗牌。默认为 True,False 可以加快速度。

返回:
samplessingle item or ndarray

生成的随机样本

引发:
ValueError

如果 a 是一个负整数,如果 p 不是一维的,如果 a 是一个大小为 0 的类数组,如果 p 不是一个概率向量,如果 ap 的长度不同,或者如果 replace=False 且样本大小大于总体大小。

另请参阅

integers, shuffle, permutation

备注

通过 p 设置用户指定的概率比默认值使用更通用但效率较低的采样器。即使 p 的每个元素都等于 1 / len(a),通用采样器产生的样本也与优化采样器不同。

p 在转换为 float64 时必须求和为 1。为确保这一点,您可能希望使用 p = p / np.sum(p, dtype=float) 进行归一化。

a 作为整数类型传递且未指定 size 时,返回类型是原生的 Python int

示例

从 np.arange(5) 生成大小为 3 的均匀随机样本

>>> rng = np.random.default_rng()
>>> rng.choice(5, 3)
array([0, 3, 4]) # random
>>> #This is equivalent to rng.integers(0,5,3)

从 np.arange(5) 生成大小为 3 的非均匀随机样本

>>> rng.choice(5, 3, p=[0.1, 0, 0.3, 0.6, 0])
array([3, 3, 0]) # random

从 np.arange(5) 生成大小为 3 的不带放回的均匀随机样本

>>> rng.choice(5, 3, replace=False)
array([3,1,0]) # random
>>> #This is equivalent to rng.permutation(np.arange(5))[:3]

从二维数组沿第一个轴(默认)生成均匀随机样本,不带放回

>>> rng.choice([[0, 1, 2], [3, 4, 5], [6, 7, 8]], 2, replace=False)
array([[3, 4, 5], # random
       [0, 1, 2]])

从 np.arange(5) 生成大小为 3 的非均匀随机样本,不带放回

>>> rng.choice(5, 3, replace=False, p=[0.1, 0, 0.3, 0.6, 0])
array([2, 3, 0]) # random

以上任何一种都可以用任意类数组代替整数来重复。例如

>>> aa_milne_arr = ['pooh', 'rabbit', 'piglet', 'Christopher']
>>> rng.choice(aa_milne_arr, 5, p=[0.5, 0.1, 0.1, 0.3])
array(['pooh', 'pooh', 'pooh', 'Christopher', 'piglet'], # random
      dtype='<U11')