Я запутался в использовании лучшей модели для прогнозирования набора тестовых данных с использованием CatBoostClassifer.
Сначала я обучил модель, используя следующий код: -
model = CatBoostClassifier(eval_metric='AUC',random_seed=42,use_best_model=True,verbose=1)
model.fit(X_train, y_train,cat_features=categorical_features_indices,eval_set=(X_validation,
y_validation),plot=True);
И я получаю оценку as bestTest = 0.8291620043
Далее я использую следующий код для перекрестной проверки: -
cv_params = model.get_params()
cv_params.update({'loss_function': 'Logloss'})
cv_data = cv(Pool(X, y, cat_features=categorical_features_indices),cv_params,fold_count=10,)
И я получаю лучший результат как 0,832801311
Теперь я хочу сделать прогноз используя лучшую модель оценки. В настоящее время я делаю predictions = model.predict(X_test)
Использую ли я здесь лучшую модель подсчета очков?
Я смущен, является ли моя модель из cv или обычной.
Пожалуйста предложите мне, если я пропускаю или делаю что-то не так здесь