Да, объединение данных испытаний с данными поезда не требуется. Вы можете повторно использовать определения функций для входящих тестовых данных. Например, когда вы используете DFS для данных поезда, определения характеристик, которые включают locations.PERCENT_TRUE(no_show)
, возвращаются вместе с матрицей характеристик.
fm, features = ft.dfs(
entityset=es_train,
target_entity='appointments',
...
)
В тестовых данных вы можете создать набор сущностей и использовать его повторно. определения для расчета функций.
fm = ft.calculate_feature_matrix(
features=features,
entityset=es_test,
...
)
Дайте мне знать, если это поможет.