Данные делятся случайным образом, если я использую функцию train_test_split. Я не хочу случайных данных для поезда.
По умолчанию это случайное, да, но вы можете сделать это НЕ случайным.
Если вы вызываете функцию, делая train_test_split(X, y, test_size=0.33, shuffle=False)
. Обратите внимание на параметр shuffle :
Независимо от того, нужно ли перетасовывать данные перед разбиением
Вы достигнете своей цели разделения без случайных разбиений.
Наконец, train_test_split разделяет строки набора данных с помощью test_size, поэтому, если вы хотите сделать это вручную, имейте в виду, что вы должны разбивать строки, а не столбцы, и сохраняйте соответствующие столбцы для X и Y .