numpy.tensordot#
- numpy.tensordot(a, b, axes=2)[source]#
沿指定轴计算张量点积。
给定两个张量 a 和 b,以及一个包含两个类数组对象(
a_axes
,b_axes
)的类数组对象,对 a 和 b 的元素(分量)在a_axes
和b_axes
指定的轴上求积之和。第三个参数可以是一个非负的类整数标量N
;如果是,则对 a 的最后N
个维度和 b 的前N
个维度求和。- 参数:
- a, b类数组
要进行“点积”运算的张量。
- axes整数或 (2,) 类数组
类整数 如果是整数 N,则依次对 a 的最后 N 个轴和 b 的前 N 个轴求和。对应轴的大小必须匹配。
(2,) 类数组 或者,一个要进行求和的轴列表,第一个序列应用于 a,第二个应用于 b。两个类数组元素必须长度相同。
- 返回:
- outputndarray
输入的张量点积。
注解
- 三种常见用例是
axes = 0
: 张量积 \(a\otimes b\)axes = 1
: 张量点积 \(a\cdot b\)axes = 2
: (默认) 张量双重收缩 \(a:b\)
当 axes 是类整数时,求值轴的顺序将是:从 a 的第 -N 个轴到第 -1 个轴,以及从 b 的第 0 个轴到第 (N-1) 个轴。例如,
axes = 2
等同于axes = [[-2, -1], [0, 1]]
。当 N-1 小于 0,或当 -N 大于 -1 时,a 和 b 的元素被定义为 axes。当有多个轴需要求和时(且它们不是 a 的最后轴或 b 的第一个轴),参数 axes 应包含两个等长的序列,其中第一个要求和的轴在两个序列中都排在首位,第二个轴排在第二位,依此类推。该计算可参考
numpy.einsum
。结果的形状由第一个张量中未收缩的轴组成,然后是第二个张量中未收缩的轴。
示例
类整数示例
>>> a_0 = np.array([[1, 2], [3, 4]]) >>> b_0 = np.array([[5, 6], [7, 8]]) >>> c_0 = np.tensordot(a_0, b_0, axes=0) >>> c_0.shape (2, 2, 2, 2) >>> c_0 array([[[[ 5, 6], [ 7, 8]], [[10, 12], [14, 16]]], [[[15, 18], [21, 24]], [[20, 24], [28, 32]]]])
类数组示例
>>> a = np.arange(60.).reshape(3,4,5) >>> b = np.arange(24.).reshape(4,3,2) >>> c = np.tensordot(a,b, axes=([1,0],[0,1])) >>> c.shape (5, 2) >>> c array([[4400., 4730.], [4532., 4874.], [4664., 5018.], [4796., 5162.], [4928., 5306.]])
一种较慢但等效的计算方式…
>>> d = np.zeros((5,2)) >>> for i in range(5): ... for j in range(2): ... for k in range(3): ... for n in range(4): ... d[i,j] += a[k,n,i] * b[n,k,j] >>> c == d array([[ True, True], [ True, True], [ True, True], [ True, True], [ True, True]])
一个利用 + 和 * 运算符重载的扩展示例
>>> a = np.array(range(1, 9)) >>> a.shape = (2, 2, 2) >>> A = np.array(('a', 'b', 'c', 'd'), dtype=object) >>> A.shape = (2, 2) >>> a; A array([[[1, 2], [3, 4]], [[5, 6], [7, 8]]]) array([['a', 'b'], ['c', 'd']], dtype=object)
>>> np.tensordot(a, A) # third argument default is 2 for double-contraction array(['abbcccdddd', 'aaaaabbbbbbcccccccdddddddd'], dtype=object)
>>> np.tensordot(a, A, 1) array([[['acc', 'bdd'], ['aaacccc', 'bbbdddd']], [['aaaaacccccc', 'bbbbbdddddd'], ['aaaaaaacccccccc', 'bbbbbbbdddddddd']]], dtype=object)
>>> np.tensordot(a, A, 0) # tensor product (result too long to incl.) array([[[[['a', 'b'], ['c', 'd']], ...
>>> np.tensordot(a, A, (0, 1)) array([[['abbbbb', 'cddddd'], ['aabbbbbb', 'ccdddddd']], [['aaabbbbbbb', 'cccddddddd'], ['aaaabbbbbbbb', 'ccccdddddddd']]], dtype=object)
>>> np.tensordot(a, A, (2, 1)) array([[['abb', 'cdd'], ['aaabbbb', 'cccdddd']], [['aaaaabbbbbb', 'cccccdddddd'], ['aaaaaaabbbbbbbb', 'cccccccdddddddd']]], dtype=object)
>>> np.tensordot(a, A, ((0, 1), (0, 1))) array(['abbbcccccddddddd', 'aabbbbccccccdddddddd'], dtype=object)
>>> np.tensordot(a, A, ((2, 1), (1, 0))) array(['acccbbdddd', 'aaaaacccccccbbbbbbdddddddd'], dtype=object)