numpy.cov#

numpy.cov(m, y=None, rowvar=True, bias=False, ddof=None, fweights=None, aweights=None, *, dtype=None)[源代码]#

根据数据和权重估计协方差矩阵。

协方差表示两个变量同时变化的程度。如果我们考察 N 维样本 \(X = [x_1, x_2, ..., x_N]^T\)，则协方差矩阵元素 \(C_{ij}\) 是 \(x_i\) 和 \(x_j\) 的协方差。元素 \(C_{ii}\) 是 \(x_i\) 的方差。

请参阅注释以了解算法的概述。

参数:

marray_like: 一个包含多个变量和观测值的 1-D 或 2-D 数组。m 的每一行代表一个变量，每一列代表所有这些变量的一个单独观测值。另请参阅下面的 rowvar。
yarray_like, optional: 一组额外的变量和观测值。y 的形式与 m 相同。
rowvarbool, optional: 如果 rowvar 为 True（默认），则每一行代表一个变量，列中包含观测值。否则，关系将被转置：每一列代表一个变量，而行包含观测值。
biasbool, optional: 默认归一化（False）是按 (N - 1) 进行的，其中 N 是提供的观测值数量（无偏估计）。如果 bias 为 True，则归一化按 N 进行。在 numpy 版本 >= 1.5 中，可以使用 ddof 关键字覆盖这些值。
ddofint, optional: 如果不是 None，则 bias 所隐含的默认值将被覆盖。请注意，即使同时指定了 fweights 和 aweights，ddof=1 也会返回无偏估计，而 ddof=0 将返回简单平均值。有关详细信息，请参阅注释。默认值为 None。
fweightsarray_like, int, optional: 整数频率权重的一维数组；每个观测向量应重复的次数。
aweightsarray_like, optional: 观测向量权值的一维数组。这些相对权重通常对于被认为是“重要”的观测值较大，对于被认为是“不太重要”的观测值较小。如果 ddof=0，则权重数组可用于为观测向量分配概率。
dtype数据类型，可选: 结果的数据类型。默认情况下，返回的数据类型至少具有 numpy.float64 精度。

新功能，版本 1.20。

返回:

outndarray
变量的协方差矩阵。

另请参阅

corrcoef
归一化的协方差矩阵

备注

假设观测值位于观测数组 m 的列中，并为简洁起见，令 f = fweights 和 a = aweights。计算加权协方差的步骤如下：

>>> m = np.arange(10, dtype=np.float64) >>> f = np.arange(10) * 2 >>> a = np.arange(10) ** 2. >>> ddof = 1 >>> w = f * a >>> v1 = np.sum(w) >>> v2 = np.sum(w * a) >>> m -= np.sum(m * w, axis=None, keepdims=True) / v1 >>> cov = np.dot(m * w, m.T) * v1 / (v1**2 - ddof * v2)

请注意，当 a == 1 时，归一化因子 v1 / (v1**2 - ddof * v2) 将变为 1 / (np.sum(f) - ddof)，正如应该的那样。

示例

>>> import numpy as np

考虑两个变量 \(x_0\) 和 \(x_1\)，它们完全相关，但方向相反

>>> x = np.array([[0, 2], [1, 1], [2, 0]]).T >>> x array([[0, 1, 2], [2, 1, 0]])

注意 \(x_0\) 如何增加而 \(x_1\) 如何减小。协方差矩阵清楚地显示了这一点。

>>> np.cov(x) array([[ 1., -1.], [-1., 1.]])

请注意，元素 \(C_{0,1}\)（表示 \(x_0\) 和 \(x_1\) 之间的相关性）是负的。

此外，请注意 x 和 y 是如何组合的

>>> x = [-2.1, -1, 4.3] >>> y = [3, 1.1, 0.12] >>> X = np.stack((x, y), axis=0) >>> np.cov(X) array([[11.71 , -4.286 ], # may vary [-4.286 , 2.144133]]) >>> np.cov(x, y) array([[11.71 , -4.286 ], # may vary [-4.286 , 2.144133]]) >>> np.cov(x) array(11.71)

上一页

numpy.correlate

下一页

numpy.histogram

在此页面

cov