У меня есть один фрейм данных, и я хочу использовать featuretools для автоматической разработки компонентов. Я могу сделать это с помощью функции нормализации сущностей. фрагмент кода ниже:
es = ft.EntitySet(id = 'obs_data')
es = es.entity_from_dataframe(entity_id = 'obs', dataframe = X_train,
variable_types = variable_types, make_index = True, index = "Id")
for feat in interaction: # interaction columns are found using xgbfir
es = es.normalize_entity(base_entity_id='obs', new_entity_id=feat, index=feat)
features, feature_names = ft.dfs(entityset = es,
target_entity = 'obs',
max_depth = 2)
Особенности его создания. Теперь я хочу сделать то же самое для X_test. Я читаю блоги по этому вопросу, и они предлагают объединить X_train и X_test, а затем сделать тот же процесс. Предположим, что в X_test есть 5 наблюдений, и если я объединю его с X_train, то каждое наблюдение (из X_test) будет иметь эффект и других 4 наблюдений (X_test), что не очень хорошая идея. Кто-нибудь может посоветовать, как сделать проектирование объектов с помощью featuretools для новых данных?