numpy.partition#

numpy.partition(a, kth, axis=-1, kind='introselect', order=None)[源代码]#

返回数组的一个分区副本。

创建数组的一个副本并对其进行部分排序,使得第 k 个位置的元素位于它在排序数组中应有的位置。在输出数组中,所有小于第 k 个元素的元素都位于该元素的左侧,所有等于或大于该元素的元素都位于其右侧。输出数组中第 k 个元素两侧的两个分区中元素的顺序是未定义的。

参数:
aarray_like

要排序的数组。

kthint 或 整数序列

用于分区的元素索引。元素的第 k 个值将位于其最终排序位置,所有较小的元素将移到其前面,所有相等或较大的元素将移到其后面。分区中所有元素的顺序是未定义的。如果提供 k-th 值的序列,它将把所有由这些 k-th 值索引的元素一次性分区到其排序位置。

自 1.22.0 版本弃用: 将布尔值作为索引传递已弃用。

axisint 或 None,可选

排序所沿的轴。如果为 None,则在排序前将数组展平。默认值为 -1,表示沿最后一个轴排序。

kind{‘introselect’},可选

选择算法。默认是 ‘introselect’。

orderstr 或 字符串列表,可选

a 是一个定义了字段的数组时,此参数指定首先、其次等要比较的字段。单个字段可以指定为字符串。并非所有字段都需要指定,但未指定的字段仍将按照它们在 dtype 中出现的顺序用于打破平局。

返回:
partitioned_arrayndarray

a 类型和形状相同的数组。

另请参阅

ndarray.partition

就地排序数组的方法。

argpartition

间接分区。

sort

完全排序

备注

各种选择算法的特点是其平均速度、最坏情况性能、工作空间大小以及是否稳定。稳定排序会保持具有相同键的项的相对顺序不变。可用算法具有以下特性

种类

速度

最坏情况

工作空间

稳定

‘introselect’

1

O(n)

0

除最后一个轴外,所有分区算法在沿任何其他轴进行分区时都会创建数据的临时副本。因此,沿最后一个轴进行分区比沿任何其他轴进行分区更快且占用更少空间。

复数的排序顺序是字典序的。如果实部和虚部都不是 NaN,则排序顺序由实部决定,除非它们相等,在这种情况下,顺序由虚部决定。

np.nan 的排序顺序大于 np.inf

示例

>>> import numpy as np
>>> a = np.array([7, 1, 7, 7, 1, 5, 7, 2, 3, 2, 6, 2, 3, 0])
>>> p = np.partition(a, 4)
>>> p
array([0, 1, 2, 1, 2, 5, 2, 3, 3, 6, 7, 7, 7, 7]) # may vary

p[4] 是 2;所有 p[:4] 中的元素都小于或等于 p[4],所有 p[5:] 中的元素都大于或等于 p[4]。分区结果是

[0, 1, 2, 1], [2], [5, 2, 3, 3, 6, 7, 7, 7, 7]

下一个示例展示了将多个值传递给 kth 的用法。

>>> p2 = np.partition(a, (4, 8))
>>> p2
array([0, 1, 2, 1, 2, 3, 3, 2, 5, 6, 7, 7, 7, 7])

p2[4] 是 2,p2[8] 是 5。所有 p2[:4] 中的元素都小于或等于 p2[4],所有 p2[5:8] 中的元素都大于或等于 p2[4] 且小于或等于 p2[8],所有 p2[9:] 中的元素都大于或等于 p2[8]。分区结果是

[0, 1, 2, 1], [2], [3, 3, 2], [5], [6, 7, 7, 7, 7]