numpy.random.hypergeometric#
- random.hypergeometric(ngood, nbad, nsample, size=None)#
从超几何分布中抽取样本。
从具有指定参数的超几何分布中抽取样本,ngood(做好选择的方式),nbad(做坏选择的方式),以及nsample(抽样项目的数量,小于或等于总和
ngood + nbad)。注意
新代码应使用
Generator实例的hypergeometric方法;请参阅 快速入门。- 参数:
- ngoodint 或 int 的 array_like
选择“好”项目的数量。必须为非负数。
- nbadint 或 int 的 array_like
选择“坏”项目的数量。必须为非负数。
- nsampleint 或 int 的 array_like
采样的项目数量。必须至少为 1,且最多为
ngood + nbad。- sizeint 或 int 的元组,可选
输出形状。如果给定的形状是,例如,
(m, n, k),那么将抽取m * n * k个样本。如果 size 是None(默认),当 ngood、nbad 和 nsample 都是标量时,将返回单个值。否则,将抽取np.broadcast(ngood, nbad, nsample).size个样本。
- 返回:
- outndarray 或标量
从参数化的超几何分布中抽取的样本。每个样本是取自 ngood 个好项目和 nbad 个坏项目的集合中的大小为 nsample 的随机子集中好项目的数量。
另请参阅
scipy.stats.hypergeom概率密度函数、分布或累积密度函数等。
random.Generator.hypergeometric新代码应使用此方法。
备注
超几何分布的概率质量函数(PMF)为
\[P(x) = \frac{\binom{g}{x}\binom{b}{n-x}}{\binom{g+b}{n}},\]其中 \(0 \le x \le n\) 且 \(n-b \le x \le g\)
对于 P(x),即在抽取的样本中获得
x个好结果的概率,g = ngood,b = nbad,n = nsample。考虑一个带有黑白大理石的瓮,其中 ngood 个是黑色的,nbad 个是白色的。如果你不放回地抽取 nsample 个球,那么超几何分布描述了抽样样本中黑色球的分布。
请注意,这个分布与二项分布非常相似,只是在这里,样本是无放回抽取的,而在二项分布情况下,样本是有放回抽取的(或样本空间是无限的)。随着样本空间的增大,这个分布接近二项分布。
参考
[1]Lentner, Marvin,“Elementary Applied Statistics”,Bogden and Quigley, 1972。
[2]Weisstein, Eric W. “Hypergeometric Distribution.” From MathWorld–A Wolfram Web Resource. https://mathworld.net.cn/HypergeometricDistribution.html
[3]Wikipedia, “Hypergeometric distribution”, https://en.wikipedia.org/wiki/Hypergeometric_distribution
示例
从分布中绘制样本
>>> ngood, nbad, nsamp = 100, 2, 10 # number of good, number of bad, and number of samples >>> s = np.random.hypergeometric(ngood, nbad, nsamp, 1000) >>> from matplotlib.pyplot import hist >>> hist(s) # note that it is very unlikely to grab both bad items
假设你有一个瓮,里面有 15 个白球和 15 个黑球。如果你随机抽取 15 个球,其中 12 个或更多是同一种颜色的可能性有多大?
>>> s = np.random.hypergeometric(15, 15, 15, 100000) >>> sum(s>=12)/100000. + sum(s<=3)/100000. # answer = 0.003 ... pretty unlikely!