numpy.random.RandomState.f#
方法
- random.RandomState.f(dfnum, dfden, size=None)#
从 F 分布中抽取样本。
样本是从具有指定参数的 F 分布中抽取的,dfnum (分子自由度) 和 dfden (分母自由度),其中两个参数必须大于零。
F 分布(也称为费舍尔分布)的随机变量是方差分析检验中出现的连续概率分布,并且是两个卡方变量的比率。
- 参数:
- dfnumfloat 或 float 的类数组
分子自由度,必须 > 0。
- dfdenfloat 或 float 的类数组
分母自由度,必须 > 0。
- sizeint 或 int 元组,可选
输出形状。如果给定的形状是,例如,
(m, n, k)
,则抽取m * n * k
个样本。如果 size 是None
(默认值),如果dfnum
和dfden
均为标量,则返回单个值。否则,抽取np.broadcast(dfnum, dfden).size
个样本。
- 返回:
- outndarray 或标量
从参数化的费舍尔分布中抽取的样本。
另请参阅
scipy.stats.f
概率密度函数、分布或累积密度函数等。
random.Generator.f
应该用于新代码。
注释
F 统计量用于比较组内方差与组间方差。计算分布取决于抽样,因此它是问题中相应自由度的函数。变量 dfnum 是样本数减 1,即组间自由度,而 dfden 是组内自由度,即每组样本数之和减去组数。
参考
[1]Glantz, Stanton A. “生物统计学入门”, McGraw-Hill, 第五版, 2002。
[2]维基百科,“F 分布”,https://en.wikipedia.org/wiki/F-distribution
示例
Glantz[1] 第 47-40 页中的一个示例
两组,糖尿病患者的子女(25 人)和无糖尿病患者的子女(25 名对照)。测量了空腹血糖,病例组的平均值为 86.1,对照组的平均值为 82.2。标准差分别为 2.09 和 2.49。这些数据是否与父母糖尿病状况不影响其子女血糖水平的零假设一致?根据数据计算 F 统计量,得出的值为 36.01。
从分布中抽取样本
>>> dfnum = 1. # between group degrees of freedom >>> dfden = 48. # within groups degrees of freedom >>> s = np.random.f(dfnum, dfden, 1000)
样本顶部 1% 的下限是
>>> np.sort(s)[-10] 7.61988120985 # random
因此,F 统计量超过 7.62 的概率约为 1%,测量值为 36,因此在 1% 的水平上拒绝零假设。