Какова цель n_splits в sklean.model_selection.StratifiedShuffleSplit? - PullRequest
0 голосов
/ 09 июня 2018

Я недавно начал работать со sklearn и спотыкаться о функции Straiftied

ShuffleSplit.Несмотря на то, что я понимаю его концепцию и то, для чего она предназначена, я не совсем понимаю аргументы, необходимые для ее работы, такие как n_split .На основе документации sklearn написано, что

n_splits: int, default 10 Число итераций перестановки и разбиения.

Мое лучшее предположение, что это говоритфункция StratifieShufflesplit определяет количество звездочек в данных.

1 Ответ

0 голосов
/ 09 июня 2018

n_splits - это параметр почти каждого перекрестного валидатора.В общем, он определяет, сколько разных наборов валидации (и обучения) вы создадите.Если вы используете StratifiedShuffleSplit, то не обозначает количество страт - это подразумевается из соответствующих относительных частот целей классификации в вашем наборе данных.

См. Ниже цитату из официальных документов (полная ссылка здесь )

StratifiedShuffleSplit

StraifiedShuffleSplit являетсявариант ShuffleSplit, который возвращает расслоенные расщепления, т.е. который создает расщепления, сохраняя тот же процент для каждого целевого класса, что и в полном наборе.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...