Есть ли аккуратный способ проверить наличие в интервале всех значений в массиве, используя панд (или другой инструмент python)? - PullRequest
0 голосов
/ 12 января 2019

pandas.Interval может использоваться, чтобы определить, аккуратно ли значение попадает в интервал, например ::

In [1]: import numpy as np

In [2]: import pandas as pd

In [3]: iv = pd.Interval(0, 5.5)

In [4]: 4.37 in iv
Out[4]: True

Можно ли проверить включение для всех элементов массива вместо одного значения? Результат будет таким же, как в:

In [5]: arr = np.array(((1,8),(-4,3.5)))

In [6]: arr
Out[6]:
array([[ 1. ,  8. ],
       [-4. ,  3.5]])

In [7]: (arr > iv.left) & (arr <= iv.right)
Out[7]:
array([[ True, False],
       [False,  True]])

Но с использованием более простого синтаксиса, который хорош в pd.Interval. Нечто подобное ниже, которое не работает:

In [8]: arr in iv
---------------------------------------------------------------------------
ValueError                                Traceback (most recent call last)
<ipython-input-15-a118a68ee023> in <module>()
----> 1 arr in iv

pandas/_libs/interval.pyx in pandas._libs.interval.Interval.__contains__()

ValueError: The truth value of an array with more than one element is ambiguous. Use a.any() or a.all()

1 Ответ

0 голосов
/ 12 января 2019

Проверьте с vectorize

def youf(x,iv):
    return x in iv

vfunc = np.vectorize(youf)

iv = pd.Interval(0, 5.5)

vfunc(arr, iv)
Out[27]: 
array([[ True, False],
       [False,  True]])
...