Эти два модуля выполняют разные операции.
train_test_split
, как ясно следует из его названия, используется для разделения данных на одно подмножество обучения и одного теста, а аргумент stratify
позволяет это делать с другой стороны,
StratifiedShuffleSplit
, с другой стороны, обеспечивает разбиения для перекрестной проверки; из документов :
Стратифицированный перекрестный валидатор ShuffleSplit
Предоставляет индексы поезда / теста для разделения данных в поездах / тестах наборы .
Обратите внимание на множественное число комплектов (выделено мной).
Итак, вместо 1025 *KFold
* 1027 можно использовать StratifiedShuffleSplit
* когда мы хотим обеспечить расслоение CV, а не заменять train_test_split
.