numpy.random.Generator.negative_binomial#
方法
- random.Generator.negative_binomial(n, p, size=None)#
从负二项分布中抽取样本。
从指定参数的负二项分布中抽取样本,n 次成功和 p 次成功的概率,其中 n > 0 且 p 在区间 (0, 1] 内。
- 参数:
- nfloat 或类似数组的 float
分布的参数,> 0。
- pfloat 或类似数组的 float
分布的参数。必须满足 0 < p <= 1。
- sizeint 或 int 元组,可选
输出形状。如果给定的形状为,例如,
(m, n, k)
,则将绘制m * n * k
个样本。如果 size 为None
(默认值),则如果n
和p
均为标量,则返回单个值。否则,将绘制np.broadcast(n, p).size
个样本。
- 返回值:
- outndarray 或标量
从参数化的负二项分布中绘制的样本,其中每个样本等于 N,即在达到 n 次成功的总数之前发生的失败次数。
注释
负二项分布的概率质量函数为
\[P(N;n,p) = \frac{\Gamma(N+n)}{N!\Gamma(n)}p^{n}(1-p)^{N},\]其中 \(n\) 是成功次数,\(p\) 是成功的概率,\(N+n\) 是试验次数,\(\Gamma\) 是伽马函数。当 \(n\) 为整数时,\(\frac{\Gamma(N+n)}{N!\Gamma(n)} = \binom{N+n-1}{N}\),这是 pmf 中该项的更常见形式。负二项分布给出了在最后一次试验成功的情况下,给定 n 次成功的 N 次失败的概率。
如果一个人反复掷骰子直到第三次出现“1”,那么在第三次出现“1”之前出现的非“1”的次数的概率分布就是负二项分布。
因为此方法在内部调用
Generator.poisson
并使用一个中间随机值,所以当 \(n\) 和 \(p\) 的选择会导致抽取的中间分布的均值 + 10 个标准差超过Generator.poisson
方法的最大可接受值时,会引发 ValueError。当 \(p\) 太低(每次成功都会发生很多失败)且 \(n\) 太大(允许很多成功)时,就会发生这种情况。因此,\(n\) 和 \(p\) 值必须满足约束\[n\frac{1-p}{p}+10n\sqrt{n}\frac{1-p}{p}<2^{63}-1-10\sqrt{2^{63}-1},\]其中等式左侧是作为泊松样本的 \(lam\) 参数内部使用的伽马分布样本的推导的均值 + 10 个标准差,而等式右侧是
Generator.poisson
中 \(lam\) 的最大值的约束。参考资料
[1]Weisstein,Eric W. “负二项分布”。来自 MathWorld - Wolfram 网页资源。 https://mathworld.wolfram.com/NegativeBinomialDistribution.html
[2]维基百科,“负二项分布”,https://en.wikipedia.org/wiki/Negative_binomial_distribution
示例
从分布中抽取样本
一个现实世界的例子。一家公司钻探野猫石油勘探井,每个井的估计成功概率为 0.1。每口井成功一次的概率是多少,也就是说,钻探 5 口井后成功一次的概率是多少,钻探 6 口井后成功一次的概率是多少,等等?
>>> rng = np.random.default_rng() >>> s = rng.negative_binomial(1, 0.1, 100000) >>> for i in range(1, 11): ... probability = sum(s<i) / 100000. ... print(i, "wells drilled, probability of one success =", probability)