рассортировать аргумент в train_test_split против StratifiedShuffleSplit - PullRequest
0 голосов
/ 19 апреля 2020

В чем разница между использованием аргумента stratify в функции train_test_split в sklearn и функцией StratifiedShuffleSplit? Разве они не делают то же самое?

1 Ответ

1 голос
/ 19 апреля 2020

Эти два модуля выполняют разные операции.

train_test_split, как ясно следует из его названия, используется для разделения данных на одно подмножество обучения и одного теста, а аргумент stratify позволяет это делать с другой стороны,

StratifiedShuffleSplit, с другой стороны, обеспечивает разбиения для перекрестной проверки; из документов :

Стратифицированный перекрестный валидатор ShuffleSplit

Предоставляет индексы поезда / теста для разделения данных в поездах / тестах наборы .

Обратите внимание на множественное число комплектов (выделено мной).

Итак, вместо 1025 *KFold* 1027 можно использовать StratifiedShuffleSplit * когда мы хотим обеспечить расслоение CV, а не заменять train_test_split.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...