Можно ли использовать перемешивание в ресэмпле? - PullRequest
0 голосов
/ 07 мая 2020

Я выполняю проверку Fold, используя три набора данных, объединенных в один pandas фреймворк. Я создаю разные образцы записей 20k, 40k и 60k. фрейм данных. В таком случае имеет смысл использовать параметр shuffle, например X, y = resample (shuffle(X, y, n_samples=20000, replace=False, stratify=y))

.

1 Ответ

1 голос
/ 07 мая 2020

Не нужно просить перетасовать вручную; документация показывает, что данные действительно перетасовываются по умолчанию, и вы можете указать начальное значение для воспроизводимости (выделено мной):

random_state: int, Экземпляр RandomState или None, необязательный (по умолчанию = None)

Начальное значение генератора псевдослучайных чисел для использования при перемешивании данных.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...