ndarrays 的索引#

另请参阅

索引例程

ndarrays 可以使用标准 Python x[obj] 语法进行索引,其中 *x* 是数组,*obj* 是选择器。根据 *obj* 的不同,可以使用不同类型的索引:基本索引、高级索引和字段访问。

以下大多数示例展示了在引用数组中的数据时索引的使用。这些示例在为数组赋值时同样有效。有关赋值方式的具体示例和说明,请参阅 为索引数组赋值

请注意,在 Python 中,x[(exp1, exp2, ..., expN)] 等效于 x[exp1, exp2, ..., expN];后者只是前者的语法糖。

基本索引#

单元素索引#

单元素索引的工作方式与其他标准 Python 序列完全相同。它是基于 0 的,并接受负索引来从数组的末尾进行索引。

>>> x = np.arange(10)
>>> x[2]
2
>>> x[-2]
8

无需将每个维度的索引分成自己的方括号集。

>>> x.shape = (2, 5)  # now x is 2-dimensional
>>> x[1, 3]
8
>>> x[1, -1]
9

请注意,如果用少于维度的索引来索引多维数组,则会得到一个子维数组。例如

>>> x[0]
array([0, 1, 2, 3, 4])

也就是说,每个指定的索引都会选择对应于所选其余维度的数组。在上面的示例中,选择 0 表示长度为 5 的剩余维度未指定,返回的是具有该维度和大小的数组。必须注意的是,返回的数组是一个 视图,即它不是原始数组的副本,而是指向与原始数组相同的内存位置的值。在这种情况下,返回第一个位置 (0) 的一维数组。因此,在返回的数组上使用单个索引,结果返回单个元素。也就是说

>>> x[0][2]
2

因此请注意 x[0, 2] == x[0][2],尽管第二种情况效率较低,因为在第一次索引之后会创建一个新的临时数组,随后该数组被索引为 2。

注意

NumPy 使用 C 顺序索引。这意味着最后一个索引通常表示变化最快的内存位置,这与 Fortran 或 IDL 不同,在 Fortran 或 IDL 中,第一个索引表示变化最快的内存位置。这种差异可能导致很大的混淆。

切片和步幅#

基本切片将 Python 的基本切片概念扩展到 N 维。当 *obj* 是 slice 对象(通过括号内的 start:stop:step 符号构造)、整数或切片对象和整数的元组时,就会发生基本切片。Ellipsisnewaxis 对象也可以与它们交织在一起。

用 *N* 个整数进行索引的最简单情况是返回一个 数组标量,表示相应的项目。与 Python 一样,所有索引都是基于零的:对于第 *i* 个索引 \(n_i\),有效范围是 \(0 \le n_i < d_i\),其中 \(d_i\) 是数组形状的第 *i* 个元素。负索引被解释为从数组的末尾计数(即,如果 \(n_i < 0\),则表示 \(n_i + d_i\))。

通过基本切片生成的全部数组始终是原始数组的 视图

注意

NumPy 切片创建 视图 而不是副本,这与内置 Python 序列(如字符串、元组和列表)不同。从大型数组中提取一小部分(提取后变得无用)时,必须小心,因为提取的小部分包含对大型原始数组的引用,在从中派生的所有数组被垃圾回收之前,其内存不会被释放。在这种情况下,建议显式使用 copy()

序列切片的标准规则适用于每个维度的基本切片(包括使用步长索引)。一些有用的概念包括

  • 基本切片语法是 i:j:k,其中 *i* 是起始索引,*j* 是停止索引,*k* 是步长 (\(k\neq0\))。这将选择具有索引值 *i*、*i + k*、…、*i + (m - 1) k* 的 *m* 个元素(在相应的维度中),其中 \(m = q + (r\neq0)\),而 *q* 和 *r* 是将 *j - i* 除以 *k* 得到的商和余数:*j - i = q k + r*,因此 *i + (m - 1) k < j*。例如

    >>> x = np.array([0, 1, 2, 3, 4, 5, 6, 7, 8, 9])
    >>> x[1:7:2]
    array([1, 3, 5])
    
  • 负 *i* 和 *j* 被解释为 *n + i* 和 *n + j*,其中 *n* 是相应维度中元素的数量。负 *k* 使步进走向较小的索引。从上面的示例

    >>> x[-2:10]
    array([8, 9])
    >>> x[-3:3:-1]
    array([7, 6, 5, 4])
    
  • 假设 *n* 是被切片的维度中元素的数量。然后,如果没有给出 *i*,则对于 *k > 0*,它默认为 0,对于 *k < 0*,它默认为 *n - 1*。如果没有给出 *j*,则对于 *k > 0*,它默认为 *n*,对于 *k < 0*,它默认为 *-n-1*。如果没有给出 *k*,则默认为 1。请注意 ::: 相同,表示选择此轴上的所有索引。从上面的示例

    >>> x[5:]
    array([5, 6, 7, 8, 9])
    
  • 如果选择元组中的对象数量少于 *N*,则对于任何后续维度都假定为 :。例如

    >>> x = np.array([[[1],[2],[3]], [[4],[5],[6]]])
    >>> x.shape
    (2, 3, 1)
    >>> x[1:2]
    array([[[4],
            [5],
            [6]]])
    
  • 整数 *i* 返回与 i:i+1 相同的值,**但**返回对象的维度减少了 1。特别是,选择元组的第 *p* 个元素是一个整数(所有其他条目为 :),则返回具有维度 *N - 1* 的相应子数组。如果 *N = 1*,则返回的对象是数组标量。这些对象在 标量 中有解释。

  • 如果选择元组的所有条目都是 :,除了第 *p* 个条目是一个切片对象 i:j:k,则返回的数组具有维度 *N*,它沿第 *p* 个轴堆叠由元素 *i*、*i+k*、…、*i + (m - 1) k < j* 的整数索引返回的子数组。

  • 在切片元组中有多个非 : 条目的基本切片,就像使用单个非 : 条目重复应用切片一样,其中非 : 条目被连续取用(所有其他非 : 条目被替换为 :)。因此,在基本切片下,x[ind1, ..., ind2,:] 就像 x[ind1][..., ind2, :] 一样。

    警告

    以上内容对高级索引**不适用**。

  • 可以使用切片设置数组中的值,但是(与列表不同)你永远无法增大数组的大小。在x[obj] = value中设置的值的大小必须与x[obj]的形状相同(或可广播到相同的形状)。

  • 切片元组总是可以构造为obj,并用于x[obj]表示法中。切片对象可以在构造中代替[start:stop:step]表示法使用。例如,x[1:10:5, ::-1]也可以实现为obj = (slice(1, 10, 5), slice(None, None, -1)); x[obj]。这对于构建适用于任意维数组的通用代码非常有用。更多信息请参见程序中处理可变数量的索引

维度索引工具#

有一些工具可以方便地将数组形状与表达式和赋值进行匹配。

Ellipsis 展开到选择元组所需数量的:对象,以索引所有维度。在大多数情况下,这意味着展开的选择元组的长度为x.ndim。只能存在一个省略号。从上面的例子

>>> x[..., 0]
array([[1, 2, 3],
      [4, 5, 6]])

这等价于

>>> x[:, :, 0]
array([[1, 2, 3],
      [4, 5, 6]])

选择元组中的每个newaxis对象都用来将结果选择的维度扩展一个单位长度的维度。添加的维度是newaxis对象在选择元组中的位置。newaxisNone的别名,并且可以使用None代替它,结果相同。从上面的例子

>>> x[:, np.newaxis, :, :].shape
(2, 1, 3, 1)
>>> x[:, None, :, :].shape
(2, 1, 3, 1)

这对于以否则需要显式重塑操作的方式组合两个数组非常方便。例如

>>> x = np.arange(5)
>>> x[:, np.newaxis] + x[np.newaxis, :]
array([[0, 1, 2, 3, 4],
      [1, 2, 3, 4, 5],
      [2, 3, 4, 5, 6],
      [3, 4, 5, 6, 7],
      [4, 5, 6, 7, 8]])

高级索引#

当选择对象obj是非元组序列对象、ndarray(数据类型为整数或布尔值)或至少包含一个序列对象或ndarray(数据类型为整数或布尔值)的元组时,将触发高级索引。高级索引有两种类型:整数和布尔。

高级索引总是返回数据的副本(与返回视图的基本切片形成对比)。

警告

高级索引的定义意味着x[(1, 2, 3),]x[(1, 2, 3)]从根本上不同。后者等价于x[1, 2, 3],它将触发基本选择,而前者将触发高级索引。请务必理解为什么会发生这种情况。

整数数组索引#

整数数组索引允许根据项目的N维索引选择数组中的任意项目。每个整数数组代表该维度中的一些索引。

索引数组中允许使用负值,它们的作用与单个索引或切片相同。

>>> x = np.arange(10, 1, -1)
>>> x
array([10,  9,  8,  7,  6,  5,  4,  3,  2])
>>> x[np.array([3, 3, 1, 8])]
array([7, 7, 9, 2])
>>> x[np.array([3, 3, -3, 8])]
array([7, 7, 4, 2])

如果索引值超出范围,则会抛出IndexError

>>> x = np.array([[1, 2], [3, 4], [5, 6]])
>>> x[np.array([1, -1])]
array([[3, 4],
      [5, 6]])
>>> x[np.array([3, 4])]
Traceback (most recent call last):
  ...
IndexError: index 3 is out of bounds for axis 0 with size 3

当索引包含与被索引数组的维度一样多的整数数组时,索引很简单,但与切片不同。

高级索引总是广播并作为一个进行迭代。

result[i_1, ..., i_M] == x[ind_1[i_1, ..., i_M], ind_2[i_1, ..., i_M],
                           ..., ind_N[i_1, ..., i_M]]

请注意,结果形状与(广播)索引数组形状ind_1, ..., ind_N相同。如果索引不能广播到相同的形状,则会引发异常IndexError: shape mismatch: indexing arrays could not be broadcast together with shapes...

使用多维索引数组进行索引往往是不常见的用法,但它们是允许的,并且对于某些问题很有用。我们将从最简单的多维情况开始。

>>> y = np.arange(35).reshape(5, 7)
>>> y
array([[ 0,  1,  2,  3,  4,  5,  6],
       [ 7,  8,  9, 10, 11, 12, 13],
       [14, 15, 16, 17, 18, 19, 20],
       [21, 22, 23, 24, 25, 26, 27],
       [28, 29, 30, 31, 32, 33, 34]])
>>> y[np.array([0, 2, 4]), np.array([0, 1, 2])]
array([ 0, 15, 30])

在这种情况下,如果索引数组具有匹配的形状,并且对于被索引数组的每个维度都有一个索引数组,则结果数组具有与索引数组相同的形状,并且值对应于索引数组中每个位置的索引集。在这个例子中,两个索引数组的第一个索引值都是0,因此结果数组的第一个值是y[0, 0]。下一个值是y[2, 1],最后一个是y[4, 2]

如果索引数组的形状不相同,则会尝试将它们广播到相同的形状。如果它们不能广播到相同的形状,则会引发异常。

>>> y[np.array([0, 2, 4]), np.array([0, 1])]
Traceback (most recent call last):
  ...
IndexError: shape mismatch: indexing arrays could not be broadcast
together with shapes (3,) (2,)

广播机制允许将索引数组与其他索引的标量组合。其效果是标量值用于索引数组的所有对应值。

>>> y[np.array([0, 2, 4]), 1]
array([ 1, 15, 29])

跳到下一个复杂级别,可以使用索引数组对数组进行部分索引。理解在这种情况下会发生什么需要一些思考。例如,如果我们只对y使用一个索引数组

>>> y[np.array([0, 2, 4])]
array([[ 0,  1,  2,  3,  4,  5,  6],
       [14, 15, 16, 17, 18, 19, 20],
       [28, 29, 30, 31, 32, 33, 34]])

它将创建一个新数组,其中索引数组的每个值从被索引数组中选择一行,并且结果数组具有结果形状(索引元素的数量,行的数量)。

通常,结果数组的形状将是索引数组的形状(或所有索引数组广播到的形状)与被索引数组中任何未使用的维度(未被索引的维度)的形状的连接。

示例

从每一行中,应该选择一个特定元素。行索引只是[0, 1, 2],列索引指定为相应行选择的元素,这里为[0, 1, 0]。使用两者一起,可以使用高级索引解决此任务。

>>> x = np.array([[1, 2], [3, 4], [5, 6]])
>>> x[[0, 1, 2], [0, 1, 0]]
array([1, 4, 5])

为了实现与上述基本切片类似的行为,可以使用广播。函数ix_可以帮助进行此广播。最好通过示例来理解这一点。

示例

从一个4x3数组中,应该使用高级索引选择角元素。因此,需要选择列为[0, 2]之一且行为[0, 3]之一的所有元素。为了使用高级索引,需要*显式地*选择所有元素。使用前面解释的方法,可以编写

>>> x = np.array([[ 0,  1,  2],
...               [ 3,  4,  5],
...               [ 6,  7,  8],
...               [ 9, 10, 11]])
>>> rows = np.array([[0, 0],
...                  [3, 3]], dtype=np.intp)
>>> columns = np.array([[0, 2],
...                     [0, 2]], dtype=np.intp)
>>> x[rows, columns]
array([[ 0,  2],
       [ 9, 11]])

但是,由于上面的索引数组只是重复自身,因此可以使用广播(比较诸如rows[:, np.newaxis] + columns之类的运算)来简化此操作。

>>> rows = np.array([0, 3], dtype=np.intp)
>>> columns = np.array([0, 2], dtype=np.intp)
>>> rows[:, np.newaxis]
array([[0],
       [3]])
>>> x[rows[:, np.newaxis], columns]
array([[ 0,  2],
       [ 9, 11]])

此广播也可以使用函数ix_来实现。

>>> x[np.ix_(rows, columns)]
array([[ 0,  2],
       [ 9, 11]])

请注意,如果没有np.ix_调用,则只会选择对角线元素。

>>> x[rows, columns]
array([ 0, 11])

这种差异是关于使用多个高级索引进行索引时最重要的是要记住的事情。

示例

高级索引可能很有用的一个实际示例是颜色查找表,我们希望将图像的值映射到用于显示的RGB三元组。查找表可以具有形状(nlookup, 3)。使用形状为(ny, nx)且dtype=np.uint8(或任何整数类型,只要值在查找表的范围内)的图像对这样的数组进行索引将产生一个形状为(ny, nx, 3)的数组,其中每个像素位置都关联一个RGB值的三元组。

布尔数组索引#

obj是布尔类型的数组对象(例如比较运算符返回的结果)时,就会发生这种高级索引。单个布尔索引数组实际上与x[obj.nonzero()]几乎相同,其中,如上所述,obj.nonzero()返回一个元组(长度为obj.ndim),包含整数索引数组,这些数组显示了objTrue元素的位置。但是,当obj.shape == x.shape时,它速度更快。

如果obj.ndim == x.ndimx[obj]将返回一个一维数组,其中填充了对应于objTrue值的x的元素。搜索顺序将是行优先(C风格)。如果obj的形状与x的对应维度不匹配,则会引发索引错误,无论这些值是True还是False

这一个常见用例是过滤所需的元素值。例如,可能需要选择数组中所有不是numpy.nan的条目。

>>> x = np.array([[1., 2.], [np.nan, 3.], [np.nan, np.nan]])
>>> x[~np.isnan(x)]
array([1., 2., 3.])

或者希望向所有负元素添加一个常数。

>>> x = np.array([1., -1., -2., 3])
>>> x[x < 0] += 20
>>> x
array([ 1., 19., 18., 3.])

一般来说,如果索引包含布尔数组,则结果将与在相同位置插入obj.nonzero()并使用上面描述的整数数组索引机制相同。x[ind_1, boolean_array, ind_2]等效于x[(ind_1,) + boolean_array.nonzero() + (ind_2,)]

如果只有一个布尔数组且没有整数索引数组,则很简单。只需要注意确保布尔索引的维度与它应该处理的数组维度完全相同。

通常,当布尔数组的维度小于被索引的数组时,这等效于x[b, ...],这意味着x由b索引,然后是尽可能多的:来填充x的秩。因此,结果的形状是一个维度,包含布尔数组中True元素的数量,后面跟着被索引数组的其余维度。

>>> x = np.arange(35).reshape(5, 7)
>>> b = x > 20
>>> b[:, 5]
array([False, False, False,  True,  True])
>>> x[b[:, 5]]
array([[21, 22, 23, 24, 25, 26, 27],
      [28, 29, 30, 31, 32, 33, 34]])

这里从被索引的数组中选择第4行和第5行,并将它们组合成一个二维数组。

示例

从数组中选择所有总和不大于2的行。

>>> x = np.array([[0, 1], [1, 1], [2, 2]])
>>> rowsum = x.sum(-1)
>>> x[rowsum <= 2, :]
array([[0, 1],
       [1, 1]])

结合多个布尔索引数组或布尔数组与整数索引数组,最好使用obj.nonzero()类比来理解。函数ix_也支持布尔数组,并且可以毫无意外地工作。

示例

使用布尔索引选择所有总和为偶数的行。同时,应使用高级整数索引选择第0列和第2列。使用ix_函数,这可以用以下方法完成:

>>> x = np.array([[ 0,  1,  2],
...               [ 3,  4,  5],
...               [ 6,  7,  8],
...               [ 9, 10, 11]])
>>> rows = (x.sum(-1) % 2) == 0
>>> rows
array([False,  True, False,  True])
>>> columns = [0, 2]
>>> x[np.ix_(rows, columns)]
array([[ 3,  5],
       [ 9, 11]])

如果不使用np.ix_调用,则只会选择对角线元素。

或者不使用np.ix_(比较整数数组示例)。

>>> rows = rows.nonzero()[0]
>>> x[rows[:, np.newaxis], columns]
array([[ 3,  5],
       [ 9, 11]])

示例

使用形状为(2, 3)且有四个True元素的二维布尔数组从形状为(2, 3, 5)的三维数组中选择行,结果将是一个形状为(4, 5)的二维结果。

>>> x = np.arange(30).reshape(2, 3, 5)
>>> x
array([[[ 0,  1,  2,  3,  4],
        [ 5,  6,  7,  8,  9],
        [10, 11, 12, 13, 14]],
      [[15, 16, 17, 18, 19],
        [20, 21, 22, 23, 24],
        [25, 26, 27, 28, 29]]])
>>> b = np.array([[True, True, False], [False, True, True]])
>>> x[b]
array([[ 0,  1,  2,  3,  4],
      [ 5,  6,  7,  8,  9],
      [20, 21, 22, 23, 24],
      [25, 26, 27, 28, 29]])

组合高级索引和基本索引#

当索引中至少有一个切片(:)、省略号(...)或newaxis(或数组的维度多于高级索引的数量)时,行为可能会更复杂。这就像连接每个高级索引元素的索引结果。

在最简单的情况下,只有一个高级索引与切片组合。例如:

>>> y = np.arange(35).reshape(5,7)
>>> y[np.array([0, 2, 4]), 1:3]
array([[ 1,  2],
       [15, 16],
       [29, 30]])

实际上,切片和索引数组操作是独立的。切片操作提取索引为1和2的列(即第2列和第3列),然后是索引数组操作,该操作提取索引为0、2和4的行(即第一行、第三行和第五行)。这等效于:

>>> y[:, 1:3][np.array([0, 2, 4]), :]
array([[ 1,  2],
       [15, 16],
       [29, 30]])

例如,单个高级索引可以替换切片,结果数组将相同。但是,它是一个副本,并且可能具有不同的内存布局。如果可能,切片更可取。例如:

>>> x = np.array([[ 0,  1,  2],
...               [ 3,  4,  5],
...               [ 6,  7,  8],
...               [ 9, 10, 11]])
>>> x[1:2, 1:3]
array([[4, 5]])
>>> x[1:2, [1, 2]]
array([[4, 5]])

理解多个高级索引组合的最简单方法可能是考虑结果形状。索引操作有两个部分:由基本索引(不包括整数)定义的子空间和高级索引部分的子空间。需要区分两种索引组合的情况:

  • 高级索引由切片、Ellipsisnewaxis分隔。例如x[arr1, :, arr2]

  • 高级索引彼此相邻。例如x[..., arr1, arr2, :],但不是x[arr1, :, 1],因为在这方面1是一个高级索引。

在第一种情况下,高级索引操作产生的维度在结果数组中排在前面,子空间维度排在其后。在第二种情况下,高级索引操作的维度被插入到结果数组中与它们在初始数组中的位置相同的位置(后一种逻辑使得简单的高级索引的行为就像切片一样)。

示例

假设x.shape是(10, 20, 30),而ind是一个形状为(2, 5, 2)的索引intp数组,则result = x[..., ind, :]的形状为(10, 2, 5, 2, 30),因为形状为(20,)的子空间已被形状为(2, 5, 2)的广播索引子空间替换。如果我们让i、j、k循环遍历形状为(2, 5, 2)的子空间,则result[..., i, j, k, :] = x[..., ind[i, j, k], :]。此示例产生的结果与x.take(ind, axis=-2)相同。

示例

x.shape为(10, 20, 30, 40, 50),并假设ind_1ind_2可以广播到形状(2, 3, 4)。然后x[:, ind_1, ind_2]的形状为(10, 2, 3, 4, 40, 50),因为X的形状为(20, 30)的子空间已被索引的形状为(2, 3, 4)的子空间替换。但是,x[:, ind_1, :, ind_2]的形状为(2, 3, 4, 10, 30, 50),因为没有明确的位置可以放入索引子空间,因此它被附加到开头。始终可以使用.transpose()将子空间移动到任何所需的位置。请注意,此示例无法使用take复制。

示例

切片可以与广播布尔索引组合。

>>> x = np.arange(35).reshape(5, 7)
>>> b = x > 20
>>> b
array([[False, False, False, False, False, False, False],
      [False, False, False, False, False, False, False],
      [False, False, False, False, False, False, False],
      [ True,  True,  True,  True,  True,  True,  True],
      [ True,  True,  True,  True,  True,  True,  True]])
>>> x[b[:, 5], 1:3]
array([[22, 23],
      [29, 30]])

字段访问#

另请参阅

结构化数组

如果ndarray对象是结构化数组,则可以通过使用字符串(类似于字典)对数组进行索引来访问数组的字段

索引x['field-name']返回数组的新视图,该视图与x的形状相同(除非字段是子数组),但数据类型为x.dtype['field-name'],并且只包含指定字段中的数据部分。此外,记录数组标量也可以这样“索引”。

结构化数组的索引也可以使用字段名列表进行,例如 x[['field-name1', 'field-name2']]。从 NumPy 1.16 版本开始,这将返回一个只包含这些字段的视图。在较旧的 NumPy 版本中,它返回的是副本。有关多字段索引的更多信息,请参阅用户指南中关于 结构化数组 的部分。

如果访问的字段是子数组,则子数组的维度将附加到结果的形状。例如

>>> x = np.zeros((2, 2), dtype=[('a', np.int32), ('b', np.float64, (3, 3))])
>>> x['a'].shape
(2, 2)
>>> x['a'].dtype
dtype('int32')
>>> x['b'].shape
(2, 2, 3, 3)
>>> x['b'].dtype
dtype('float64')

扁平迭代器索引#

x.flat 返回一个迭代器,它将遍历整个数组(以 C 连续样式,最后一个索引变化最快)。只要选择对象不是元组,就可以使用基本的切片或高级索引对这个迭代器对象进行索引。从 x.flat 是一个一维视图这一事实可以清楚地看出这一点。它可以用于使用一维 C 样式扁平索引进行整数索引。因此,任何返回数组的形状都是整数索引对象的形状。

为索引数组赋值#

如前所述,可以使用单个索引、切片和索引以及掩码数组来选择要赋值的数组子集。赋值给索引数组的值必须与形状一致(相同的形状或可广播到索引生成的形状)。例如,允许将常量赋值给切片

>>> x = np.arange(10)
>>> x[2:7] = 1

或一个大小合适的数组

>>> x[2:7] = np.arange(5)

请注意,如果将较高类型赋值给较低类型(例如,将浮点数赋值给整数),或者甚至出现异常(将复数赋值给浮点数或整数),则赋值可能会导致更改。

>>> x[1] = 1.2
>>> x[1]
1
>>> x[1] = 1.2j  
Traceback (most recent call last):
  ...
TypeError: can't convert complex to int

与某些引用(例如数组和掩码索引)不同,赋值总是对数组中的原始数据进行(事实上,没有什么比这更有意义了!)。但是请注意,某些操作可能无法像人们天真地期望的那样工作。这个具体的例子经常让大家感到惊讶

>>> x = np.arange(0, 50, 10)
>>> x
array([ 0, 10, 20, 30, 40])
>>> x[np.array([1, 1, 3, 1])] += 1
>>> x
array([ 0, 11, 20, 31, 40])

人们期望第一个位置将增加 3。事实上,它只会增加 1。原因是从原始数组中提取一个新的数组(作为临时数组),包含 1, 1, 3, 1 的值,然后将值 1 添加到临时数组,然后将临时数组赋值回原始数组。因此,数组在 x[1] + 1 的值被赋值给 x[1] 三次,而不是被递增三次。

在程序中处理可变数量的索引#

索引语法非常强大,但在处理可变数量的索引时却受到限制。例如,如果您想编写一个可以处理具有不同维度数量的参数的函数,而无需为每个可能的维度数量编写特殊情况代码,那么该如何做到呢?如果向索引提供一个元组,则该元组将被解释为索引列表。例如

>>> z = np.arange(81).reshape(3, 3, 3, 3)
>>> indices = (1, 1, 1, 1)
>>> z[indices]
40

因此,可以使用代码构造任意数量索引的元组,然后在索引中使用这些元组。

可以通过在 Python 中使用 slice() 函数来指定切片。例如

>>> indices = (1, 1, 1, slice(0, 2))  # same as [1, 1, 1, 0:2]
>>> z[indices]
array([39, 40])

同样,可以通过使用 Ellipsis 对象在代码中指定省略号

>>> indices = (1, Ellipsis, 1)  # same as [1, ..., 1]
>>> z[indices]
array([[28, 31, 34],
       [37, 40, 43],
       [46, 49, 52]])

因此,可以直接使用 np.nonzero() 函数的输出作为索引,因为它总是返回一个索引数组元组。

由于对元组的特殊处理,它们不会像列表那样自动转换为数组。例如

>>> z[[1, 1, 1, 1]]  # produces a large array
array([[[[27, 28, 29],
         [30, 31, 32], ...
>>> z[(1, 1, 1, 1)]  # returns a single value
40

详细说明#

以下是一些详细说明,对于日常索引并不重要(无特定顺序)

  • NumPy 原生索引类型是 intp,可能与默认整数数组类型不同。intp 是安全索引任何数组的最小数据类型;对于高级索引,它可能比其他类型更快。

  • 对于高级赋值,通常不能保证迭代顺序。这意味着如果一个元素被设置多次,则无法预测最终结果。

  • 空(元组)索引是零维数组的完整标量索引。x[()] 如果 x 是零维的则返回一个 *标量*,否则返回一个视图。另一方面,x[...] 总是返回一个视图。

  • 如果索引中存在零维数组 *并且* 它是一个完整的整数索引,则结果将是一个 *标量*,而不是一个零维数组。(不会触发高级索引。)

  • 当存在省略号 (...) 但大小为零(即替换零 :)时,结果仍然始终是一个数组。如果不存在高级索引,则为视图,否则为副本。

  • 布尔数组的 nonzero 等价性不适用于零维布尔数组。

  • 当高级索引操作的结果没有元素但单个索引超出范围时,是否引发 IndexError 是未定义的(例如,x[[], [123]],其中 123 超出范围)。

  • 当赋值期间发生 *类型转换* 错误(例如,使用字符串序列更新数值数组)时,被赋值的数组最终可能处于不可预测的部分更新状态。但是,如果发生任何其他错误(例如索引超出范围),则数组将保持不变。

  • 高级索引结果的内存布局针对每个索引操作进行了优化,并且不能假设任何特定的内存顺序。

  • 当使用子类(特别是操纵其形状的子类)时,默认的 ndarray.__setitem__ 行为将对 *基本* 索引调用 __getitem__,但对 *高级* 索引不调用。对于这样的子类,最好使用数据的 *基类* ndarray 视图调用 ndarray.__setitem__。如果子类的 __getitem__ 不返回视图,则 *必须* 执行此操作。