Я не буду предлагать отключать параметр shuffle
в вашей функции train_test_split
, а держите переменную random_state
фиксированной для воспроизводимых разбиений.Лучше разделить случайно, чем разделить, скажем, верхние 20% набора данных могут исказить ваши данные.
from sklearn.model_selection import train_test_split
X_train, X_test, y_train, y_test = train_test_split(Input, Output, test_size = 0.20, random_state = 0)
Если метки разделения неверны, вы должны убедиться, что переменные Output и Input назначены правильно или нет.