numpy.matmul#

numpy.matmul(x1, x2, /, out=None, *, casting='same_kind', order='K', dtype=None, subok=True[, signature, axes, axis]) = <ufunc 'matmul'>#

两个数组的矩阵乘积。

参数:
x1, x2array_like

输入数组,不允许标量。

outndarray, 可选

存储结果的位置。如果提供,其形状必须与签名 (n,k),(k,m)->(n,m) 匹配。如果不提供或为 None,则返回一个新分配的数组。

**kwargs**

对于其他仅限关键字的参数,请参见 ufunc 文档

返回:
yndarray

输入的矩阵乘积。只有当 x1、x2 都是一维向量时,它才是标量。

引发:
ValueError

如果 x1 的最后一维大小与 x2 的倒数第二维大小不同。

如果传入标量值。

另请参见

vecdot

向量堆栈的复共轭点积。

matvec

矩阵和向量的堆栈的矩阵向量积。

vecmat

向量和矩阵的堆栈的向量矩阵积。

tensordot

任意轴上的和积。

einsum

爱因斯坦求和约定。

dot

具有不同广播规则的替代矩阵乘积。

备注

行为取决于参数,方式如下。

  • 如果两个参数都是二维的,则像常规矩阵一样相乘。

  • 如果任一参数是 N 维的,N > 2,则将其视为位于最后两个索引中的矩阵堆栈,并相应地进行广播。

  • 如果第一个参数是一维的,则通过在其维数前添加 1 来将其提升为矩阵。矩阵乘法后,删除预先添加的 1。(对于向量堆栈,使用 vecmat。)

  • 如果第二个参数是一维的,则通过在其维数后附加 1 来将其提升为矩阵。矩阵乘法后,删除附加的 1。(对于向量堆栈,使用 matvec。)

matmuldot 有两个重要区别

  • 不允许进行标量乘法,请改用 *

  • 矩阵堆栈一起广播,就像矩阵是元素一样,遵守签名 (n,k),(k,m)->(n,m)

    >>> a = np.ones([9, 5, 7, 4])
    >>> c = np.ones([9, 5, 4, 3])
    >>> np.dot(a, c).shape
    (9, 5, 7, 9, 5, 3)
    >>> np.matmul(a, c).shape
    (9, 5, 7, 3)
    >>> # n is 7, k is 4, m is 3
    

matmul 函数实现了 Python 3.5 中引入的 @ 运算符的语义,遵循 PEP 465

它尽可能使用优化的 BLAS 库(参见 numpy.linalg)。

示例

对于二维数组,它是矩阵乘积

>>> import numpy as np
>>> a = np.array([[1, 0],
...               [0, 1]])
>>> b = np.array([[4, 1],
...               [2, 2]])
>>> np.matmul(a, b)
array([[4, 1],
       [2, 2]])

对于二维与一维混合,结果是通常的。

>>> a = np.array([[1, 0],
...               [0, 1]])
>>> b = np.array([1, 2])
>>> np.matmul(a, b)
array([1, 2])
>>> np.matmul(b, a)
array([1, 2])

数组堆栈的广播是常规的

>>> a = np.arange(2 * 2 * 4).reshape((2, 2, 4))
>>> b = np.arange(2 * 2 * 4).reshape((2, 4, 2))
>>> np.matmul(a,b).shape
(2, 2, 2)
>>> np.matmul(a, b)[0, 1, 1]
98
>>> sum(a[0, 1, :] * b[0 , :, 1])
98

向量、向量返回标量内积,但任一参数都不会进行复共轭

>>> np.matmul([2j, 3j], [2j, 3j])
(-13+0j)

标量乘法会引发错误。

>>> np.matmul([1,2], 3)
Traceback (most recent call last):
...
ValueError: matmul: Input operand 1 does not have enough dimensions ...

@ 运算符可以用作 ndarray 上 np.matmul 的简写。

>>> x1 = np.array([2j, 3j])
>>> x2 = np.array([2j, 3j])
>>> x1 @ x2
(-13+0j)