numpy.random.Generator.negative_binomial#

方法

random.Generator.negative_binomial(n, p, size=None)#

从负二项分布中抽取样本。

样本是从具有指定参数的负二项分布中抽取的,其中 n 为成功次数,p 为成功概率,且 n > 0,p 在区间 (0, 1] 内。

参数
n浮点数或浮点数数组

分布参数,> 0。

p浮点数或浮点数数组

分布参数。必须满足 0 < p <= 1。

size整数或整数元组,可选

输出形状。如果给定形状为,例如,(m, n, k),则抽取 m * n * k 个样本。如果 size 为 None(默认),则当 np 均为标量时,返回单个值。否则,抽取 np.broadcast(n, p).size 个样本。

返回
outndarray 或标量

从参数化的负二项分布中抽取的样本,其中每个样本等于 N,即在达到总共 n 次成功之前发生的失败次数。

注释

负二项分布的概率质量函数为

\[P(N;n,p) = \frac{\Gamma(N+n)}{N!\Gamma(n)}p^{n}(1-p)^{N},\]

其中 \(n\) 是成功次数,\(p\) 是成功概率,\(N+n\) 是试验次数,\(\Gamma\) 是伽马函数。当 \(n\) 是整数时,\(\frac{\Gamma(N+n)}{N!\Gamma(n)} = \binom{N+n-1}{N}\),这是 pmf 中此项的更常见形式。负二项分布给出在最后一次试验成功的情况下,N 次失败在 n 次成功之前的概率。

如果反复投掷骰子,直到“1”出现第三次,则在第三次“1”出现之前出现的非“1”的次数的概率分布是负二项分布。

由于此方法内部使用中间随机值调用 Generator.poisson,因此当选择 \(n\)\(p\) 导致采样中间分布的均值 + 10 sigma 超过 Generator.poisson 方法的最大可接受值时,会引发 ValueError。这发生在 \(p\) 过低(每次成功发生大量失败)且 \(n\) 过大(允许大量成功)时。因此,\(n\)\(p\) 值必须满足以下约束:

\[n\frac{1-p}{p}+10n\sqrt{n}\frac{1-p}{p}<2^{63}-1-10\sqrt{2^{63}-1},\]

其中方程的左侧是伽马分布样本的均值 + 10 sigma 的推导值,该伽马分布在内部用作泊松样本的 \(lam\) 参数,方程的右侧是 Generator.poisson\(lam\) 最大值的约束。

参考文献

[1]

Weisstein, Eric W. “负二项分布。” 摘自 MathWorld – Wolfram 网络资源。 https://mathworld.net.cn/NegativeBinomialDistribution.html

[2]

维基百科,“负二项分布”, https://en.wikipedia.org/wiki/Negative_binomial_distribution

示例

从分布中抽取样本

一个真实世界的例子。一家公司钻探投机性石油勘探井,每口井的估计成功概率为 0.1。那么,每口连续井获得一次成功的概率是多少,也就是说,在钻探 5 口井、6 口井等之后,获得单次成功的概率是多少?

>>> rng = np.random.default_rng()
>>> s = rng.negative_binomial(1, 0.1, 100000)
>>> for i in range(1, 11): 
...    probability = sum(s<i) / 100000.
...    print(i, "wells drilled, probability of one success =", probability)