numpy.in1d#
- numpy.in1d(ar1, ar2, assume_unique=False, invert=False, *, kind=None)[source]#
测试一维数组中的每个元素是否也存在于第二个数组中。
返回一个与 ar1 长度相同的布尔数组,其中 ar1 的元素在 ar2 中为 True,否则为 False。
- 参数:
- ar1(M,) array_like
输入数组。
- ar2array_like
用来测试 ar1 中每个值的数组。
- assume_uniquebool, 可选
如果为 True,则假定输入数组都唯一,这可以加快计算速度。默认为 False。
- invertbool, 可选
如果为 True,则返回数组中的值将被反转(即,如果 ar1 的元素在 ar2 中为 False,否则为 True)。默认为 False。
np.in1d(a, b, invert=True)
等效于(但比)np.invert(in1d(a, b))
更快。- kind{None, ‘sort’, ‘table’}, 可选
要使用的算法。这不会影响最终结果,但会影响速度和内存使用。默认值 None 将根据内存考虑因素自动选择。
如果为 ‘sort’,将使用基于归并排序的方法。这将占用大约 ar1 和 ar2 大小总和的 6 倍的内存,不包括数据类型的大小。
如果为 ‘table’,将使用类似于计数排序的查找表方法。这仅适用于布尔值和整数数组。这将占用 ar1 的大小加上 ar2 的最大值减去最小值的内存。当使用 ‘table’ 选项时,assume_unique 将不起作用。
如果为 None,将自动选择 ‘table’(如果所需的内存分配小于或等于 ar1 和 ar2 大小总和的 6 倍),否则将使用 ‘sort’。这样做是为了默认情况下不使用大量内存,即使 ‘table’ 在大多数情况下可能更快。如果选择 ‘table’,assume_unique 将不起作用。
版本 1.8.0 中的新增功能。
- 返回值:
- in1d(M,) ndarray, bool
值 ar1[in1d] 在 ar2 中。
另请参见
isin
此函数的版本,它保留 ar1 的形状。
备注
in1d
可以被视为一维序列的 Python 关键字 in 的逐元素函数版本。in1d(a, b)
大致等效于np.array([item in b for item in a])
。但是,如果 ar2 是一个集合或类似的(非序列)容器,这个想法就会失败:当ar2
转换为数组时,在这种情况下asarray(ar2)
是一个对象数组,而不是预期的包含值的数组。使用
kind='table'
通常比 kind=’sort’ 更快,如果以下关系成立:log10(len(ar2)) > (log10(max(ar2)-min(ar2)) - 2.27) / 0.927
,但可能会使用更多内存。 kind 的默认值将根据内存使用情况自动选择,因此您可以在内存限制可以放宽的情况下手动设置kind='table'
。版本 1.4.0 中的新增功能。
示例
>>> import numpy as np >>> test = np.array([0, 1, 2, 5, 0]) >>> states = [0, 2] >>> mask = np.in1d(test, states) >>> mask array([ True, False, True, False, True]) >>> test[mask] array([0, 2, 0]) >>> mask = np.in1d(test, states, invert=True) >>> mask array([False, True, False, True, False]) >>> test[mask] array([1, 5])