numpy.random.gumbel#

random.gumbel(loc=0.0, scale=1.0, size=None)#

从 Gumbel 分布中抽取样本。

从指定位置和尺度的 Gumbel 分布中抽取样本。有关 Gumbel 分布的更多信息,请参见下面的注释和参考资料。

注意

新代码应该使用 gumbel 方法,而不是 Generator 实例;请参见 快速入门

参数:
locfloat 或类似数组的浮点数,可选

分布模式的位置。默认为 0。

scalefloat 或类似数组的浮点数,可选

分布的尺度参数。默认为 1。必须是非负数。

sizeint 或 int 元组,可选

输出形状。如果给定的形状为,例如,(m, n, k),则会抽取 m * n * k 个样本。如果 size 为 None(默认),则如果 locscale 都是标量,则返回单个值。否则,将抽取 np.broadcast(loc, scale).size 个样本。

返回值:
outndarray 或标量

从参数化的 Gumbel 分布中抽取的样本。

注释

Gumbel(或最小极值 (SEV) 或最小极值类型 I)分布是用于建模极值问题的广义极值 (GEV) 分布类之一。Gumbel 是极值类型 I 分布的一种特殊情况,用于对具有“指数型”尾部的分布的最大值进行建模。

Gumbel 分布的概率密度为

\[p(x) = \frac{e^{-(x - \mu)/ \beta}}{\beta} e^{ -e^{-(x - \mu)/ \beta}},\]

其中 \(\mu\) 是模式,一个位置参数,\(\beta\) 是尺度参数。

Gumbel(以德国数学家 Emil Julius Gumbel 命名)很早就被用于水文学文献中,用于对洪水事件的发生进行建模。它还用于对最大风速和降雨量进行建模。它是一个“厚尾”分布 - 分布尾部的事件概率比使用高斯分布时更大,因此会出现令人惊讶的频繁的百年洪水。洪水最初被建模为高斯过程,这低估了极端事件的频率。

它是广义极值 (GEV) 分布类中的一种,还包括 Weibull 和 Frechet。

该函数的平均值为 \(\mu + 0.57721\beta\),方差为 \(\frac{\pi^2}{6}\beta^2\)

参考资料

[1]

Gumbel, E. J., “Extremes 的统计”,纽约:哥伦比亚大学出版社,1958 年。

[2]

Reiss, R.-D. 和 Thomas, M., “保险、金融、水文学和其他领域的极值统计分析”,巴塞尔:Birkhauser Verlag,2001 年。

示例

从分布中抽取样本

>>> mu, beta = 0, 0.1 # location and scale
>>> s = np.random.gumbel(mu, beta, 1000)

显示样本的直方图,以及概率密度函数

>>> import matplotlib.pyplot as plt
>>> count, bins, ignored = plt.hist(s, 30, density=True)
>>> plt.plot(bins, (1/beta)*np.exp(-(bins - mu)/beta)
...          * np.exp( -np.exp( -(bins - mu) /beta) ),
...          linewidth=2, color='r')
>>> plt.show()
../../../_images/numpy-random-gumbel-1_00_00.png

展示极值分布如何从高斯过程中产生,并与高斯分布进行比较

>>> means = []
>>> maxima = []
>>> for i in range(0,1000) :
...    a = np.random.normal(mu, beta, 1000)
...    means.append(a.mean())
...    maxima.append(a.max())
>>> count, bins, ignored = plt.hist(maxima, 30, density=True)
>>> beta = np.std(maxima) * np.sqrt(6) / np.pi
>>> mu = np.mean(maxima) - 0.57721*beta
>>> plt.plot(bins, (1/beta)*np.exp(-(bins - mu)/beta)
...          * np.exp(-np.exp(-(bins - mu)/beta)),
...          linewidth=2, color='r')
>>> plt.plot(bins, 1/(beta * np.sqrt(2 * np.pi))
...          * np.exp(-(bins - mu)**2 / (2 * beta**2)),
...          linewidth=2, color='g')
>>> plt.show()
../../../_images/numpy-random-gumbel-1_01_00.png