广播#
另请参阅
术语“广播”描述了 NumPy 在算术运算期间如何处理不同形状的数组。在满足某些约束条件下,较小的数组将在较大数组上“广播”,以便它们具有兼容的形状。广播提供了一种向量化数组运算的方法,以便在 C 而不是 Python 中发生循环。它在不进行不必要的复制数据的情况下执行此操作,通常会导致高效的算法实现。但是,在某些情况下,广播是一个不好的主意,因为它会导致内存使用效率低下,从而减慢计算速度。
NumPy 运算通常在两个数组上以逐元素的方式进行。在最简单的情况下,这两个数组必须具有完全相同的形状,如下例所示
>>> import numpy as np
>>> a = np.array([1.0, 2.0, 3.0])
>>> b = np.array([2.0, 2.0, 2.0])
>>> a * b
array([2., 4., 6.])
当数组的形状满足某些约束条件时,NumPy 的广播规则会放松此约束。最简单的广播示例发生在数组和标量值在运算中组合时
>>> import numpy as np
>>> a = np.array([1.0, 2.0, 3.0])
>>> b = 2.0
>>> a * b
array([2., 4., 6.])
结果等效于前面的示例,其中 b
是一个数组。我们可以认为标量 b
在算术运算期间被拉伸成一个与 a
形状相同的数组。 b
中的新元素,如图 1所示,只是原始标量的副本。拉伸类比仅是概念上的。NumPy 足够智能,可以使用原始标量值而无需实际复制,以便广播操作尽可能地节省内存和计算效率。
第二个示例中的代码比第一个示例中的代码效率更高,因为广播在乘法期间移动的内存更少(b
是标量而不是数组)。
通用广播规则#
在对两个数组进行运算时,NumPy 会逐元素比较它们的形状。它从尾随(即最右边的)维度开始,并向左工作。当两个维度满足以下条件时,它们是兼容的:
它们相等,或者
其中一个为 1。
如果这些条件不满足,则会抛出 ValueError: operands could not be broadcast together
异常,指示数组具有不兼容的形状。
输入数组不需要具有相同数量的维度。结果数组将与具有最多维度的输入数组具有相同数量的维度,其中每个维度的大小是输入数组中相应维度中的最大大小。请注意,缺少的维度假定大小为 1。
例如,如果您有一个 256x256x3
的 RGB 值数组,并且您希望按不同的值缩放图像中的每种颜色,则可以将图像乘以一个具有 3 个值的单维数组。根据广播规则对齐这些数组的尾随轴的大小,表明它们是兼容的
Image (3d array): 256 x 256 x 3
Scale (1d array): 3
Result (3d array): 256 x 256 x 3
当比较的维度之一为 1 时,将使用另一个维度。换句话说,大小为 1 的维度会被拉伸或“复制”以匹配另一个维度。
在以下示例中,A
和 B
数组都具有长度为 1 的轴,这些轴在广播操作期间扩展到更大的大小
A (4d array): 8 x 1 x 6 x 1
B (3d array): 7 x 1 x 5
Result (4d array): 8 x 7 x 6 x 5
可广播数组#
如果上述规则产生有效结果,则一组数组称为“可广播”到相同的形状。
例如,如果 a.shape
为 (5,1),b.shape
为 (1,6),c.shape
为 (6,) 且 d.shape
为 (),以便d 为标量,则a、b、c 和d 都可广播到维度 (5,6);并且
a 充当 (5,6) 数组,其中
a[:,0]
被广播到其他列,b 充当 (5,6) 数组,其中
b[0,:]
被广播到其他行,c 充当 (1,6) 数组,因此充当 (5,6) 数组,其中
c[:]
被广播到每一行,最后,d 充当 (5,6) 数组,其中单个值被重复。
以下是一些更多示例
A (2d array): 5 x 4
B (1d array): 1
Result (2d array): 5 x 4
A (2d array): 5 x 4
B (1d array): 4
Result (2d array): 5 x 4
A (3d array): 15 x 3 x 5
B (3d array): 15 x 1 x 5
Result (3d array): 15 x 3 x 5
A (3d array): 15 x 3 x 5
B (2d array): 3 x 5
Result (3d array): 15 x 3 x 5
A (3d array): 15 x 3 x 5
B (2d array): 3 x 1
Result (3d array): 15 x 3 x 5
以下是无法广播的形状示例
A (1d array): 3
B (1d array): 4 # trailing dimensions do not match
A (2d array): 2 x 1
B (3d array): 8 x 4 x 3 # second from last dimensions mismatched
将一维数组添加到二维数组时的广播示例
>>> import numpy as np
>>> a = np.array([[ 0.0, 0.0, 0.0],
... [10.0, 10.0, 10.0],
... [20.0, 20.0, 20.0],
... [30.0, 30.0, 30.0]])
>>> b = np.array([1.0, 2.0, 3.0])
>>> a + b
array([[ 1., 2., 3.],
[11., 12., 13.],
[21., 22., 23.],
[31., 32., 33.]])
>>> b = np.array([1.0, 2.0, 3.0, 4.0])
>>> a + b
Traceback (most recent call last):
ValueError: operands could not be broadcast together with shapes (4,3) (4,)
如图 2所示,b
被添加到 a
的每一行。在图 3中,由于形状不兼容,因此引发了异常。
广播提供了一种方便的方法来获取两个数组的外积(或任何其他外部运算)。以下示例显示了两个一维数组的外部加法运算
>>> import numpy as np
>>> a = np.array([0.0, 10.0, 20.0, 30.0])
>>> b = np.array([1.0, 2.0, 3.0])
>>> a[:, np.newaxis] + b
array([[ 1., 2., 3.],
[11., 12., 13.],
[21., 22., 23.],
[31., 32., 33.]])
这里,newaxis
索引运算符将一个新轴插入 a
中,使其成为一个二维 4x1
数组。将 4x1
数组与形状为 (3,)
的 b
组合,会产生一个 4x3
数组。
一个实际示例:矢量量化#
广播在现实世界的问题中经常出现。一个典型的例子出现在信息论、分类和其他相关领域中使用的矢量量化 (VQ) 算法中。VQ 中的基本操作是在一组点(在 VQ 行话中称为 codes
)中找到最接近给定点(称为 observation
)的点。在下面所示的非常简单的二维情况下,observation
中的值描述了要分类的运动员的体重和身高。 codes
代表不同类别的运动员。[1] 找到最接近的点需要计算观察值与每个代码之间的距离。最短距离提供最佳匹配。在此示例中,codes[0]
是最接近的类别,表明该运动员可能是篮球运动员。
>>> from numpy import array, argmin, sqrt, sum
>>> observation = array([111.0, 188.0])
>>> codes = array([[102.0, 203.0],
... [132.0, 193.0],
... [45.0, 155.0],
... [57.0, 173.0]])
>>> diff = codes - observation # the broadcast happens here
>>> dist = sqrt(sum(diff**2,axis=-1))
>>> argmin(dist)
0
在此示例中,observation
数组被拉伸以匹配 codes
数组的形状
Observation (1d array): 2
Codes (2d array): 4 x 2
Diff (2d array): 4 x 2
通常,大量 observations
(可能从数据库中读取)与一组 codes
进行比较。考虑以下场景
Observation (2d array): 10 x 3
Codes (3d array): 5 x 1 x 3
Diff (3d array): 5 x 10 x 3
三维数组 diff
是广播的结果,而不是计算的必要条件。大型数据集将生成一个大型中间数组,这在计算上效率低下。相反,如果使用 Python 循环围绕上面二维示例中的代码分别计算每个观察值,则将使用一个更小的数组。
广播是编写简短且通常直观的代码的强大工具,这些代码可以在 C 中非常有效地进行计算。但是,在某些情况下,广播会为特定算法使用不必要的大量内存。在这些情况下,最好在 Python 中编写算法的外循环。这还可以产生更易读的代码,因为随着广播中维度数量的增加,使用广播的算法往往变得更难以解释。
脚注