У меня есть конвейер обработки, который я отправляю в поиск по сетке, который использует пропущенный (50 выборок), чтобы определить лучшую модель следующим образомТочность, но я также хотел бы кривой RoC.Если я возьму clf.best_estimator_
и использую предсказанные вероятности из всего набора X
, чтобы создать кривую roc, будут ли эти результаты слишком оптимистичными?Оценка точности clf.best_score_
, о которой я сообщаю, усредняется по всем наборам одного выхода, но clf.best_estimator_
соответствует всему набору.Я беспокоюсь о том, что использование оценки восстановления для создания кривой roc даст слишком оптимистичные результаты.