numpy.random.RandomState.binomial#
方法
- random.RandomState.binomial(n, p, size=None)#
从二项分布中抽取样本。
从具有指定参数的二项分布中抽取样本,n 次试验和 p 次成功的概率,其中 n 为整数 >= 0 且 p 在区间 [0,1] 中。(n 可以作为浮点数输入,但在使用时会被截断为整数)
- 参数:
- nint 或类数组的 int
分布的参数,>= 0。也接受浮点数,但它们将被截断为整数。
- pfloat 或类数组的 float
分布的参数,>= 0 且 <=1。
- sizeint 或 int 元组,可选
输出形状。如果给定的形状为,例如,
(m, n, k)
,则将绘制m * n * k
个样本。如果 size 为None
(默认值),则如果n
和p
均为标量,则返回单个值。否则,将绘制np.broadcast(n, p).size
个样本。
- 返回值:
- outndarray 或标量
从参数化二项分布中抽取的样本,其中每个样本等于 n 次试验中成功的次数。
另请参阅
scipy.stats.binom
概率密度函数、分布或累积密度函数等。
random.Generator.binomial
这应该用于新代码。
备注
二项分布的概率密度为
\[P(N) = \binom{n}{N}p^N(1-p)^{n-N},\]其中 \(n\) 是试验次数,\(p\) 是成功的概率,\(N\) 是成功的次数。
当使用随机样本估计总体中比例的标准误差时,除非 p*n <=5,其中 p = 总体比例估计,n = 样本数,否则正态分布效果很好,在这种情况下,使用二项分布。例如,15 人的样本显示 4 人是左撇子,11 人是右撇子。然后 p = 4/15 = 27%。0.27*15 = 4,因此在这种情况下应使用二项分布。
参考文献
[1]Dalgaard,Peter,“使用 R 的入门统计”,Springer-Verlag,2002 年。
[2]Glantz,Stanton A.“生物统计学入门。”,McGraw-Hill,第五版,2002 年。
[3]Lentner,Marvin,“应用统计学基础”,Bogden 和 Quigley,1972 年。
[4]Weisstein,Eric W.“二项分布。”来自 MathWorld - Wolfram 网络资源。https://mathworld.wolfram.com/BinomialDistribution.html
[5]维基百科,“二项分布”,https://en.wikipedia.org/wiki/Binomial_distribution
示例
从分布中抽取样本
>>> n, p = 10, .5 # number of trials, probability of each trial >>> s = np.random.binomial(n, p, 1000) # result of flipping a coin 10 times, tested 1000 times.
一个现实世界的例子。一家公司钻探了 9 口野猫石油勘探井,每口井估计的成功概率为 0.1。所有 9 口井都失败了。发生这种情况的概率是多少?
让我们对模型进行 20,000 次试验,并计算产生零个正结果的试验次数。
>>> sum(np.random.binomial(9, 0.1, 20000) == 0)/20000. # answer = 0.38885, or 38%.