Изучив документацию , вы увидите, что первым параметром является
*arrays
, что означает, что вы можете поместить туда столько массивов, сколько захотите. Теперь, что это возвращает?
Returns: splitting : list, length=2 * len(arrays)
Это означает, что он возвращает вдвое больше массивов, переданных в функции train_test_split.
Итак, если у вас уже есть обучающий и тестовый наборы, имеет смысл разделить обучающий набор, так что вы можете иметь проверочный набор для проверки производительности модели.
Например:.
train_data, validation_data, train_label, validation_label= train_test_split(original_train_data, original_train_label)
Обратите внимание, что вы также должны разделить метки, если у вас есть данные и метка в разделенных векторах.