Как использовать прогноз для перекрестно проверенного набора данных в классификаторе catboost? - PullRequest
0 голосов
/ 21 апреля 2020

Я запутался в использовании лучшей модели для прогнозирования набора тестовых данных с использованием CatBoostClassifer.

Сначала я обучил модель, используя следующий код: -

model = CatBoostClassifier(eval_metric='AUC',random_seed=42,use_best_model=True,verbose=1)

model.fit(X_train, y_train,cat_features=categorical_features_indices,eval_set=(X_validation, 
          y_validation),plot=True);

И я получаю оценку as bestTest = 0.8291620043

Далее я использую следующий код для перекрестной проверки: -

cv_params = model.get_params()
cv_params.update({'loss_function': 'Logloss'})
cv_data = cv(Pool(X, y, cat_features=categorical_features_indices),cv_params,fold_count=10,)

И я получаю лучший результат как 0,832801311

Теперь я хочу сделать прогноз используя лучшую модель оценки. В настоящее время я делаю predictions = model.predict(X_test)

Использую ли я здесь лучшую модель подсчета очков?

Я смущен, является ли моя модель из cv или обычной.

Пожалуйста предложите мне, если я пропускаю или делаю что-то не так здесь

...