numpy.in1d#

numpy.in1d(ar1, ar2, assume_unique=False, invert=False, *, kind=None)[源代码]#

测试一维数组的每个元素是否存在于第二个数组中。

自 2.0 版本起已废弃: 新代码请使用 isin 而非 in1d。

返回一个与 ar1 长度相同的布尔数组，其中 ar1 的元素在 ar2 中时为 True，否则为 False。

参数:

ar1(M,) array_like

输入数组。

ar2array_like

用于测试 ar1 中每个值的基准值。

assume_unique布尔值，可选

如果为 True，则假定两个输入数组都具有唯一性，这可以加快计算速度。默认为 False。

invert布尔值，可选

如果为 True，则返回数组中的值将被反转（即，当 ar1 的元素在 ar2 中时为 False，否则为 True）。默认为 False。np.in1d(a, b, invert=True) 等效于（但快于）np.invert(in1d(a, b))。

kind{None, ‘sort’, ‘table’}，可选

要使用的算法。这不会影响最终结果，但会影响速度和内存使用。默认值 None 将根据内存考量自动选择。

如果为 ‘sort’，将使用基于归并排序的方法。这将占用大约 ar1 和 ar2 大小总和的 6 倍内存，不包括数据类型的大小。
如果为 ‘table’，将使用类似于计数排序的查找表方法。这仅适用于布尔数组和整数数组。这将占用 ar1 大小加上 ar2 的最大值减去最小值（max-min value）的内存。assume_unique 在使用 ‘table’ 选项时无效。
如果为 None，当所需内存分配小于或等于 ar1 和 ar2 大小总和的 6 倍时，将自动选择 ‘table’，否则将使用 ‘sort’。这样做是为了默认不占用大量内存，即使 ‘table’ 在大多数情况下可能更快。如果选择 ‘table’，assume_unique 将无效。

返回:

in1d(M,) ndarray, 布尔: 值 ar1[in1d] 存在于 ar2 中。

另请参阅

isin: 此函数的版本，它保留了 ar1 的形状。

备注

in1d 可以被认为是 Python 关键字 in 的一个逐元素函数版本，用于一维序列。in1d(a, b) 大致等价于 np.array([item in b for item in a])。然而，如果 ar2 是一个集合，或类似的（非序列）容器，这个想法就会失败：因为 ar2 会被转换为一个数组，在这些情况下，asarray(ar2) 是一个对象数组，而不是预期的包含值的数组。

如果满足以下关系：log10(len(ar2)) > (log10(max(ar2)-min(ar2)) - 2.27) / 0.927，则使用 kind='table' 通常比 kind=’sort’ 更快，但可能会占用更多内存。kind 的默认值将仅根据内存使用情况自动选择，因此如果可以放宽内存限制，可以手动设置 kind='table'。

示例

>>> import numpy as np
>>> test = np.array([0, 1, 2, 5, 0])
>>> states = [0, 2]
>>> mask = np.in1d(test, states)
>>> mask
array([ True, False,  True, False,  True])
>>> test[mask]
array([0, 2, 0])
>>> mask = np.in1d(test, states, invert=True)
>>> mask
array([False,  True, False,  True, False])
>>> test[mask]
array([1, 5])