Задание значения Popular_variables с помощью featuretools не работает - PullRequest
0 голосов
/ 06 октября 2018

В настоящее время я работаю через документацию по инструментам , используя мои собственные данные.Пока все работало нормально, но я застрял при добавлении интересных переменных.По некоторым причинам я не могу заставить это работать, и я не уверен почему.Пример в документе работает просто отлично.

После создания набора сущностей я пытаюсь получить функции для конкретного продукта Classic Cars:

## Add interesting values
es["products"]["PRODUCTLINE"].interesting_values=["Classic Cars"]

## Get features
feature_defs = ft.dfs(entityset=es,
                            target_entity="customers",
                            agg_primitives=["count"],
                            where_primitives=["count"],
                            trans_primitives=[],
                            features_only=True))

## Show features
feature_defs


OUT[1]: [<Feature: COUNTRY>, <Feature: CUSTOMERNAME>, <Feature: COUNT(transactions)>]

Я ожидаю, что это функциягде он подсчитывает количество транзакций, которые включают классические автомобили.К сожалению, этого не происходит.Он также не работает с любой другой переменной или значением, которое я пробовал.

Как вы можете видеть здесь, назначение сработало.

es["products"]["PRODUCTLINE"].interesting_values

OUT[2]: ['Classic Cars']

И Classic Cars является действительным значениемпеременная PRODUCTLINE:

es["products"].variables

OUT[3]: [<Variable: PRODUCTCODE (dtype = index)>,
 <Variable: PRODUCTLINE_ID (dtype = numeric)>,
 <Variable: PRODUCTLINE (dtype = categorical)>,
 <Variable: MSRP (dtype = numeric)>]

es["products"].df.PRODUCTLINE.head(2)

OUT[4]: S10_1678     Motorcycles
S10_1949    Classic Cars
Name: PRODUCTLINE, dtype: object

Не уверен, что я делаю неправильно, и любая помощь будет признательна!

Вот данные и код, если вы хотите их воспроизвести: https://drive.google.com/open?id=1NOeudbCkeZ66nSOZrhhBdd1jcAa1LDco

...