Используя составной оценщик с методом sklearn cross_validate, что включает аргумент «fit_time»? - PullRequest
0 голосов
/ 06 января 2020

Используя утилиту sklearn make_pipeline, вы можете создать составной оценщик, как я сделал ниже (clf). Каждый раз, когда вызывается метод cross_validate, он сначала подгоняет скейлер minmax к kfold, которые не используются для проверки, и преобразует окончательный сгиб, только тогда выполняется подбор модели.

Метод cross_validate возвращает значение называется "fit_time". Учитывает ли это время соответствия минимальное масштабирование, или это только время обучения "модели" (второй аргумент для make_pipeline).

Спасибо.

#The following clf uses minmax scaling
clf = make_pipeline(preprocessing.MinMaxScaler(), model)

results = cross_validate(clf, Data, labels, cv=kfold,return_train_score=True)

1 Ответ

1 голос
/ 06 января 2020

На основе документов :

fit_time

The time for fitting the estimator on the train set for each cv split.

Я бы сказал, что он рассчитывает только оценку, которая должна быть моделью а не выкалывание.

Но вы можете проверить его, если исключите выкалывание в одном тестовом прогоне и посмотрите, не отличается ли время.

...