numpy.partition#

numpy.partition(a, kth, axis=-1, kind='introselect', order=None)[source]#

返回数组的分区副本。

创建数组的副本并对其进行部分排序,使得第 k 个位置的元素的值位于其在排序数组中的位置。在输出数组中,所有小于第 k 个元素的元素都位于该元素的左侧,所有等于或大于该元素的元素都位于其右侧。输出数组中第 k 个元素两侧两个分区中元素的顺序是不确定的。

版本 1.8.0 中的新功能。

参数:
aarray_like

要排序的数组。

kthint 或 int 序列

要进行分区的元素索引。元素的第 k 个值将位于其最终的排序位置,所有较小的元素将被移动到其前面,所有等于或更大的元素将被移动到其后面。分区中所有元素的顺序是不确定的。如果提供了一个 kth 序列,它将同时将所有由 kth 索引的元素分区到其排序位置。

自版本 1.22.0 起已弃用: 传递布尔值作为索引已弃用。

axisint 或 None,可选

要排序的轴。如果为 None,则在排序之前先将数组展平。默认为 -1,沿着最后一个轴排序。

kind{'introselect'},可选

选择算法。默认为 'introselect'。

orderstr 或 str 列表,可选

a 是一个定义了字段的数组时,此参数指定首先比较哪些字段、其次比较哪些字段,依此类推。可以使用字符串指定单个字段。不必指定所有字段,但未指定的字段仍将按其在 dtype 中出现的顺序使用,以打破平局。

返回值:
partitioned_arrayndarray

a 类型和形状相同的数组。

另请参阅

ndarray.partition

用于就地排序数组的方法。

argpartition

间接分区。

sort

完全排序

注释

各种选择算法的特点是它们的平均速度、最坏情况下的性能、工作空间大小以及它们是否稳定。稳定的排序会将具有相同键的项目保持在相同的相对顺序。可用的算法具有以下属性

kind

速度

最坏情况

工作空间

稳定

‘introselect’

1

O(n)

0

所有分区算法在沿着除最后一个轴之外的任何轴进行分区时都会创建数据的临时副本。因此,沿着最后一个轴进行分区比沿着任何其他轴进行分区更快,并且使用的空间更少。

复数的排序顺序是词典序。如果实部和虚部均非 nan,则顺序由实部决定,除非它们相等,在这种情况下,顺序由虚部决定。

np.nan 的排序顺序大于 np.inf

示例

>>> import numpy as np
>>> a = np.array([7, 1, 7, 7, 1, 5, 7, 2, 3, 2, 6, 2, 3, 0])
>>> p = np.partition(a, 4)
>>> p
array([0, 1, 2, 1, 2, 5, 2, 3, 3, 6, 7, 7, 7, 7]) # may vary

p[4] 为 2;p[:4] 中的所有元素都小于或等于 p[4],而 p[5:] 中的所有元素都大于或等于 p[4]。分区为

[0, 1, 2, 1], [2], [5, 2, 3, 3, 6, 7, 7, 7, 7]

下一个示例显示了传递给 kth 的多个值的使用。

>>> p2 = np.partition(a, (4, 8))
>>> p2
array([0, 1, 2, 1, 2, 3, 3, 2, 5, 6, 7, 7, 7, 7])

p2[4] 为 2,p2[8] 为 5。 p2[:4] 中的所有元素都小于或等于 p2[4]p2[5:8] 中的所有元素都大于或等于 p2[4] 且小于或等于 p2[8]p2[9:] 中的所有元素都大于或等于 p2[8]。分区为

[0, 1, 2, 1], [2], [3, 3, 2], [5], [6, 7, 7, 7, 7]