numpy.random.Generator.negative_binomial#

方法

random.Generator.negative_binomial(n, p, size=None)#

从负二项分布中抽取样本。

从具有指定参数的负二项分布中抽取样本，其中 n 为成功次数，p 为成功概率，且 n > 0，p 在区间 (0, 1] 内。

参数:

n浮点数或类数组结构（浮点数）: 分布参数，> 0。
p浮点数或类数组的浮点数: 分布参数。必须满足 0 < p <= 1。
sizeint 或 int 的元组，可选: 输出形状。如果给定的形状是，例如，(m, n, k)，则抽取 m * n * k 个样本。如果 size 为 None (默认)，当 n 和 p 都是标量时，将返回单个值。否则，将抽取 np.broadcast(n, p).size 个样本。

返回:

outndarray 或标量: 从参数化的负二项分布中抽取样本，其中每个样本等于 N，即在达到 n 次成功之前发生的失败次数。

备注

负二项分布的概率质量函数为

\[P(N;n,p) = \frac{\Gamma(N+n)}{N!\Gamma(n)}p^{n}(1-p)^{N},\]

其中 \(n\) 是成功次数，\(p\) 是成功概率，\(N+n\) 是试验次数，\(\Gamma\) 是伽马函数。当 \(n\) 是整数时，\(\frac{\Gamma(N+n)}{N!\Gamma(n)} = \binom{N+n-1}{N}\)，这是此项在 pmf 中更常见的形式。负二项分布给出在 n 次成功（最后一次试验为成功）的情况下发生 N 次失败的概率。

如果重复投掷骰子直到第三次出现“1”，那么在第三次“1”出现之前出现非“1”的次数的概率分布就是负二项分布。

由于此方法在内部调用 Generator.poisson 并使用中间随机值，因此当 \(n\) 和 \(p\) 的选择会导致均值 + 10 倍标准差超过 Generator.poisson 方法可接受的最大值时，会引发 ValueError。这种情况发生在 \(p\) 太低（每次成功都会发生很多失败）和 \(n\) 太大（允许大量成功）时。因此，\(n\) 和 \(p\) 值必须满足以下约束：

\[n\frac{1-p}{p}+10n\sqrt{n}\frac{1-p}{p}<2^{63}-1-10\sqrt{2^{63}-1},\]

其中方程的左侧是内部用作泊松样本的 \(lam\) 参数的伽马分布样本的派生均值 + 10 倍标准差，方程的右侧是 Generator.poisson 中 \(lam\) 的最大值的约束。

参考

[1]

Weisstein, Eric W. “Negative Binomial Distribution.” From MathWorld–A Wolfram Web Resource. https://mathworld.net.cn/NegativeBinomialDistribution.html

[2]

Wikipedia, “Negative binomial distribution”, https://en.wikipedia.org/wiki/Negative_binomial_distribution

示例

从分布中绘制样本

一个现实世界的例子。一家公司钻探猫儿井（wild-cat oil exploration wells），每次成功的概率估计为 0.1。每口井连续成功一次的概率是多少？也就是说，钻探 5 口井后的单次成功概率是多少，钻探 6 口井后的单次成功概率是多少，依此类推？

>>> rng = np.random.default_rng()
>>> s = rng.negative_binomial(1, 0.1, 100000)
>>> for i in range(1, 11): 
...    probability = sum(s<i) / 100000.
...    print(i, "wells drilled, probability of one success =", probability)