Я пытаюсь реализовать алгоритм априори.На одном из последних шагов у меня есть два массива кортежей, сгенерированных из списка продуктов.
>>> arr1 = array([(2421,), (35682,), (30690,), ..., (18622,), (18285,), (31269,)],
dtype=object)
>>> arr2 = array([(2421, 35682), (2421, 30690), (2421, 24852), ..., (18622, 18285),
(18622, 31269), (18285, 31269)], dtype=object))
Смысл в том, что мне нужно проверить, какие из arr1
являются подтипами arr2
, то есть (2421, )
- это подтип (2421, 30690)
.
. Я попытался
>>> if (2421,) in (2421, 1231):
... print('Yes')
... else:
... print('No')
и получил No
.Я также пытался использовать .issubset
, но я получаю AtributeError
.
Я хотел бы знать, как я могу сделать это, не идя хардкорным путем,
>>> print(len(arr1), len(arr2))
(9258, 263616)
Я используюБлокнот Jupyter с Python 2. Только с использованием numpy, pandas и itertools.
Желаемый результат должен иметь вид;если у меня есть продукты 1,2,3
, но я рассматриваю только кортежи (1,)
и (2,)
, тогда мне нужно (1,2)
, но не (1,3)
из всех двух комбинаций продуктов.