Я выполняю проверку Fold, используя три набора данных, объединенных в один pandas фреймворк. Я создаю разные образцы записей 20k, 40k и 60k. фрейм данных. В таком случае имеет смысл использовать параметр shuffle
, например X, y = resample (shuffle(X, y, n_samples=20000, replace=False, stratify=y))
.