numpy.matmul#

numpy.matmul(x1, x2, /, out=None, *, casting='same_kind', order='K', dtype=None, subok=True[, signature, axes, axis]) = <ufunc 'matmul'>#

两个数组的矩阵乘积。

参数:
x1, x2array_like

输入数组,不允许标量。

outndarray, 可选

存储结果的位置。如果提供,它必须具有与签名 (n,k),(k,m)->(n,m) 匹配的形状。如果未提供或为 None,则返回新分配的数组。

**kwargs

有关其他仅关键字参数,请参阅 ufunc 文档

返回:
yndarray

输入的矩阵乘积。仅当 x1、x2 都是一维向量时,这才是标量。

引发:
ValueError

如果 x1 的最后一个维度与 x2 的倒数第二个维度大小不同。

如果传入标量值。

另请参阅

vecdot

用于向量堆栈的复共轭点积。

matvec

用于矩阵和向量堆栈的矩阵-向量乘积。

vecmat

用于向量和矩阵堆栈的向量-矩阵乘积。

tensordot

对任意轴求和乘积。

einsum

爱因斯坦求和约定。

dot

具有不同广播规则的替代矩阵乘积。

注意

行为方式取决于参数:

  • 如果两个参数都是二维的,它们将像传统矩阵一样相乘。

  • 如果任一参数是 N 维(N > 2),则将其视为位于最后两个索引中的矩阵堆栈并进行相应的广播。

  • 如果第一个参数是一维的,则通过在其维度前添加 1 来将其提升为矩阵。矩阵乘法后,前缀的 1 将被移除。(对于向量堆栈,请使用 vecmat。)

  • 如果第二个参数是一维的,则通过在其维度后添加 1 来将其提升为矩阵。矩阵乘法后,附加的 1 将被移除。(对于向量堆栈,请使用 matvec。)

matmuldot 有两个重要的不同之处:

  • 不允许与标量相乘,请改用 *

  • 矩阵堆栈会像元素一样一起广播,遵循签名 (n,k),(k,m)->(n,m)

    >>> a = np.ones([9, 5, 7, 4])
    >>> c = np.ones([9, 5, 4, 3])
    >>> np.dot(a, c).shape
    (9, 5, 7, 9, 5, 3)
    >>> np.matmul(a, c).shape
    (9, 5, 7, 3)
    >>> # n is 7, k is 4, m is 3
    

matmul 函数实现了 **PEP 465** 中定义的 @ 运算符的语义。

它在可能的情况下使用优化的 BLAS 库(参见 numpy.linalg)。

示例

对于二维数组,它是矩阵乘积

>>> import numpy as np
>>> a = np.array([[1, 0],
...               [0, 1]])
>>> b = np.array([[4, 1],
...               [2, 2]])
>>> np.matmul(a, b)
array([[4, 1],
       [2, 2]])

对于二维与一维混合,结果是常规的。

>>> a = np.array([[1, 0],
...               [0, 1]])
>>> b = np.array([1, 2])
>>> np.matmul(a, b)
array([1, 2])
>>> np.matmul(b, a)
array([1, 2])

广播对于数组堆栈来说是常规的

>>> a = np.arange(2 * 2 * 4).reshape((2, 2, 4))
>>> b = np.arange(2 * 2 * 4).reshape((2, 4, 2))
>>> np.matmul(a,b).shape
(2, 2, 2)
>>> np.matmul(a, b)[0, 1, 1]
98
>>> sum(a[0, 1, :] * b[0 , :, 1])
98

向量与向量返回标量内积,但两个参数都不是复共轭的

>>> np.matmul([2j, 3j], [2j, 3j])
(-13+0j)

标量乘法会引发错误。

>>> np.matmul([1,2], 3)
Traceback (most recent call last):
...
ValueError: matmul: Input operand 1 does not have enough dimensions ...

在 ndarray 上,@ 运算符可以用作 np.matmul 的简写。

>>> x1 = np.array([2j, 3j])
>>> x2 = np.array([2j, 3j])
>>> x1 @ x2
(-13+0j)