numpy.random.RandomState.f#

方法

random.RandomState.f(dfnum, dfden, size=None)#

从 F 分布中抽取样本。

从指定参数为 dfnum(分子自由度)和 dfden(分母自由度)的 F 分布中抽取样本,其中这两个参数必须大于零。

F 分布的随机变量(也称为费舍尔分布)是一个连续概率分布,它出现在方差分析检验中,是两个卡方变量的比率。

注意

新代码应该使用 f Generator 实例的方法;请参阅 快速入门

参数::
dfnum浮点数或浮点数数组

分子自由度,必须 > 0。

dfden浮点数或浮点数数组

分母自由度,必须 > 0。

size整数或整数元组,可选

输出形状。如果给定的形状是,例如,(m, n, k),则会抽取 m * n * k 个样本。如果 size 为 None(默认),如果 dfnumdfden 都是标量,则返回单个值。否则,将抽取 np.broadcast(dfnum, dfden).size 个样本。

返回值::
outndarray 或标量

从参数化的费舍尔分布中抽取的样本。

参见

scipy.stats.f

概率密度函数、分布或累积密度函数等。

random.Generator.f

应该用于新代码。

注释

F 统计量用于比较组内方差与组间方差。计算分布取决于抽样,因此它是问题中各自自由度的函数。变量 dfnum 是样本数减 1,组间自由度,而 dfden 是组内自由度,是每个组中的样本数之和减去组数。

参考文献

[1]

Glantz, Stanton A. “生物统计学入门”。,麦格劳-希尔,第五版,2002 年。

[2]

维基百科,“F 分布”,https://en.wikipedia.org/wiki/F-distribution

示例

来自 Glantz[1] 的示例,第 47-40 页

两组,糖尿病儿童(25 人)和非糖尿病儿童(25 个对照)。测量空腹血糖,病例组的平均值为 86.1,对照组的平均值为 82.2。标准差分别为 2.09 和 2.49。这些数据是否与父母糖尿病状况不影响其子女血糖水平的零假设一致?从数据计算 F 统计量得出值为 36.01。

从分布中抽取样本

>>> dfnum = 1. # between group degrees of freedom
>>> dfden = 48. # within groups degrees of freedom
>>> s = np.random.f(dfnum, dfden, 1000)

样本前 1% 的下限是

>>> np.sort(s)[-10]
7.61988120985 # random

因此,F 统计量超过 7.62 的概率约为 1%,测得值为 36,因此在 1% 水平上拒绝零假设。