numpy.random.RandomState.binomial#

方法

random.RandomState.binomial(n, p, size=None)#

从二项分布中抽取样本。

从具有指定参数的二项分布中抽取样本,n 为试验次数,p 为成功概率,其中 n 为整数 >= 0,p 在区间 [0,1] 内。(n 可以作为浮点数输入,但在使用中会被截断为整数)

注意

新代码应该使用 binomial 方法代替 Generator 实例;请参见 快速入门

参数:
nint 或类似数组的 ints

分布的参数,>= 0。也接受浮点数,但它们将被截断为整数。

pfloat 或类似数组的 floats

分布的参数,>= 0 且 <=1。

sizeint 或 ints 元组,可选

输出形状。如果给定的形状为,例如,(m, n, k),则将抽取 m * n * k 个样本。如果 size 为 None(默认值),则如果 np 都是标量,则返回单个值。否则,将抽取 np.broadcast(n, p).size 个样本。

返回:
outndarray 或标量

从参数化的二项分布中抽取的样本,其中每个样本等于 n 次试验中的成功次数。

参见

scipy.stats.binom

概率密度函数、分布或累积密度函数等。

random.Generator.binomial

应该用于新代码。

备注

二项分布的概率质量函数 (PMF) 为

\[P(N) = \binom{n}{N}p^N(1-p)^{n-N},\]

其中 \(n\) 是试验次数,\(p\) 是成功概率,\(N\) 是成功次数。

当使用随机样本估计总体中比例的标准误差时,除非乘积 p*n <=5(其中 p = 总体比例估计值,n = 样本数),否则正态分布效果很好,在这种情况下,使用二项分布。例如,一个 15 人的样本显示 4 人是左撇子,11 人是右撇子。那么 p = 4/15 = 27%。0.27*15 = 4,所以在这种情况下应该使用二项分布。

参考文献

[1]

Dalgaard,Peter,“使用 R 的入门统计”,Springer-Verlag,2002 年。

[2]

Glantz,Stanton A. “生物统计学入门”,McGraw-Hill,第五版,2002 年。

[3]

Lentner,Marvin,“应用统计学入门”,Bogden 和 Quigley,1972 年。

[4]

Weisstein,Eric W. “二项分布”。来自 MathWorld——Wolfram 网络资源。https://mathworld.wolfram.com/BinomialDistribution.html

[5]

维基百科,“二项分布”,https://en.wikipedia.org/wiki/Binomial_distribution

示例

从分布中抽取样本

>>> n, p = 10, .5  # number of trials, probability of each trial
>>> s = np.random.binomial(n, p, 1000)
# result of flipping a coin 10 times, tested 1000 times.

一个现实世界的例子。一家公司钻探了 9 口野猫油气勘探井,每口井估计的成功概率为 0.1。所有 9 口井都失败了。发生这种情况的概率是多少?

让我们对模型进行 20,000 次试验,并计算产生零个正结果的次数。

>>> sum(np.random.binomial(9, 0.1, 20000) == 0)/20000.
# answer = 0.38885, or 38%.