numpy.random.Generator.normal#

方法

random.Generator.normal(loc=0.0, scale=1.0, size=None)#

从正态（高斯）分布绘制随机样本。

正态分布的概率密度函数，最初由 De Moivre 提出，200 年后由 Gauss 和 Laplace 独立提出 [2]，由于其特征形状，常被称为钟形曲线（参见下面的示例）。

正态分布在自然界中很常见。例如，它描述了受到大量微小随机扰动影响的样本的常见分布，这些扰动各自具有独特的分布 [2]。

参数:

locfloat 或 float 的 array_like: 分布的均值（“中心”）。
scalefloat 或 float 的 array_like: 分布的标准差（散布或“宽度”）。必须为非负数。
sizeint 或 int 的元组，可选: 输出形状。如果给定的形状是，例如，(m, n, k)，则绘制 m * n * k 个样本。如果 size 为 None（默认），则当 loc 和 scale 均为标量时，将返回单个值。否则，将绘制 np.broadcast(loc, scale).size 个样本。

返回:

outndarray 或标量: 从参数化的正态分布绘制的样本。

另请参阅

scipy.stats.norm: 概率密度函数、分布或累积密度函数等。

备注

高斯分布的概率密度为

\[p(x) = \frac{1}{\sqrt{ 2 \pi \sigma^2 }} e^{ - \frac{ (x - \mu)^2 } {2 \sigma^2} },\]

其中 \(\mu\) 是均值，\(\sigma\) 是标准差。标准差的平方 \(\sigma^2\) 称为方差。

该函数在均值处达到峰值，其“散布”随着标准差的增加而增加（函数在 \(x + \sigma\) 和 \(x - \sigma\) 处达到最大值的 0.607 倍 [2]）。这意味着 normal 更可能返回接近均值的样本，而不是远离均值的样本。

参考

[1]

维基百科，“正态分布”，https://en.wikipedia.org/wiki/Normal_distribution

[2] (1,2,3)

P. R. Peebles Jr., “Central Limit Theorem” in “Probability, Random Variables and Random Signal Principles”, 4th ed., 2001, pp. 51, 51, 125.

示例

从分布中绘制样本

>>> mu, sigma = 0, 0.1 # mean and standard deviation
>>> rng = np.random.default_rng()
>>> s = rng.normal(mu, sigma, 1000)

验证均值和标准差

>>> abs(mu - np.mean(s))
0.0  # may vary

>>> abs(sigma - np.std(s, ddof=1))
0.0  # may vary

显示样本的直方图以及概率密度函数

>>> import matplotlib.pyplot as plt
>>> count, bins, _ = plt.hist(s, 30, density=True)
>>> plt.plot(bins, 1/(sigma * np.sqrt(2 * np.pi)) *
...                np.exp( - (bins - mu)**2 / (2 * sigma**2) ),
...          linewidth=2, color='r')
>>> plt.show()

../../../_images/numpy-random-Generator-normal-1_00_00.png

均值为 3，标准差为 2.5 的正态分布样本的二维四数组

>>> rng = np.random.default_rng()
>>> rng.normal(3, 2.5, size=(2, 4))
array([[-4.49401501,  4.00950034, -1.81814867,  7.29718677],   # random
       [ 0.39924804,  4.68456316,  4.99394529,  4.84057254]])  # random