numpy.partition#
- numpy.partition(a, kth, axis=-1, kind='introselect', order=None)[source]#
返回数组的已分区副本。
创建数组的副本并对其进行部分排序,以便第 k 个位置的元素的值在其排序数组中的位置。在输出数组中,所有小于第 k 个元素的元素都位于该元素的左侧,所有等于或大于该元素的元素都位于其右侧。输出数组中第 k 个元素两侧两个分区中元素的顺序是未定义的。
- 参数:
- a类数组
要排序的数组。
- kth整数或整数序列
要按其进行分区的元素索引。元素的第 k 个值将位于其最终排序位置,所有较小的元素将移动到其前面,所有等于或大于它的元素将移动到其后面。两个分区中所有元素的顺序是未定义的。如果提供了一个 k 值序列,它将立即将所有由 k 值索引的元素划分到其排序位置。
自版本 1.22.0 起已弃用: 传递布尔值作为索引已弃用。
- axis整数或 None,可选
要沿其排序的轴。如果为 None,则在排序前将数组展平。默认为 -1,沿最后一个轴排序。
- kind{'introselect'},可选
选择算法。默认为 'introselect'。
- order字符串或字符串列表,可选
当 a 是一个具有定义字段的数组时,此参数指定首先比较哪些字段,其次比较哪些字段,依此类推。可以使用字符串指定单个字段。不需要指定所有字段,但未指定的字段仍将按其在 dtype 中出现的顺序使用,以打破平局。
- 返回:
- partitioned_arrayndarray
与 a 类型和形状相同的数组。
另请参见
ndarray.partition
原地排序数组的方法。
argpartition
间接分区。
sort
完全排序
备注
各种选择算法的特点是它们的平均速度、最坏情况下的性能、工作空间大小以及它们是否稳定。稳定排序保持具有相同键的项目之间的相对顺序。可用的算法具有以下属性:
kind
速度
最坏情况
工作空间
稳定性
‘introselect’
1
O(n)
0
否
所有分区算法在沿最后一个轴以外的任何轴进行分区时都会创建数据的临时副本。因此,沿最后一个轴进行分区比沿任何其他轴进行分区更快,并且使用的空间更少。
复数的排序顺序是词典顺序。如果实部和虚部都是非 NaN,则顺序由实部决定,除非它们相等,在这种情况下,顺序由虚部决定。
np.nan
的排序顺序大于np.inf
。示例
>>> import numpy as np >>> a = np.array([7, 1, 7, 7, 1, 5, 7, 2, 3, 2, 6, 2, 3, 0]) >>> p = np.partition(a, 4) >>> p array([0, 1, 2, 1, 2, 5, 2, 3, 3, 6, 7, 7, 7, 7]) # may vary
p[4]
是 2;p[:4]
中的所有元素都小于或等于p[4]
,而p[5:]
中的所有元素都大于或等于p[4]
。分区是:[0, 1, 2, 1], [2], [5, 2, 3, 3, 6, 7, 7, 7, 7]
下一个示例显示了传递给 kth 的多个值的使用。
>>> p2 = np.partition(a, (4, 8)) >>> p2 array([0, 1, 2, 1, 2, 3, 3, 2, 5, 6, 7, 7, 7, 7])
p2[4]
是 2,p2[8]
是 5。p2[:4]
中的所有元素都小于或等于p2[4]
,p2[5:8]
中的所有元素都大于或等于p2[4]
且小于或等于p2[8]
,而p2[9:]
中的所有元素都大于或等于p2[8]
。分区是:[0, 1, 2, 1], [2], [3, 3, 2], [5], [6, 7, 7, 7, 7]