Я буду рекомендовать использовать
sklearn.model_selection.StratifiedKFold
На основе документа: предоставляет индексы поезда / теста для разделения данных в наборах тестов поезда.
Этот объект перекрестной проверки является разновидностью KFoldэто возвращает стратифицированные складки.Сгибы создаются с помощью с сохранением процента выборок для каждого класса.
Если вы используете resample
.Например, для модели классификатора трудно сделать так, чтобы все подданные содержали все классы.