В настоящее время я работаю через документацию по инструментам , используя мои собственные данные.Пока все работало нормально, но я застрял при добавлении интересных переменных.По некоторым причинам я не могу заставить это работать, и я не уверен почему.Пример в документе работает просто отлично.
После создания набора сущностей я пытаюсь получить функции для конкретного продукта Classic Cars
:
## Add interesting values
es["products"]["PRODUCTLINE"].interesting_values=["Classic Cars"]
## Get features
feature_defs = ft.dfs(entityset=es,
target_entity="customers",
agg_primitives=["count"],
where_primitives=["count"],
trans_primitives=[],
features_only=True))
## Show features
feature_defs
OUT[1]: [<Feature: COUNTRY>, <Feature: CUSTOMERNAME>, <Feature: COUNT(transactions)>]
Я ожидаю, что это функциягде он подсчитывает количество транзакций, которые включают классические автомобили.К сожалению, этого не происходит.Он также не работает с любой другой переменной или значением, которое я пробовал.
Как вы можете видеть здесь, назначение сработало.
es["products"]["PRODUCTLINE"].interesting_values
OUT[2]: ['Classic Cars']
И Classic Cars является действительным значениемпеременная PRODUCTLINE:
es["products"].variables
OUT[3]: [<Variable: PRODUCTCODE (dtype = index)>,
<Variable: PRODUCTLINE_ID (dtype = numeric)>,
<Variable: PRODUCTLINE (dtype = categorical)>,
<Variable: MSRP (dtype = numeric)>]
es["products"].df.PRODUCTLINE.head(2)
OUT[4]: S10_1678 Motorcycles
S10_1949 Classic Cars
Name: PRODUCTLINE, dtype: object
Не уверен, что я делаю неправильно, и любая помощь будет признательна!
Вот данные и код, если вы хотите их воспроизвести: https://drive.google.com/open?id=1NOeudbCkeZ66nSOZrhhBdd1jcAa1LDco