Как разделить фиксированное количество строк в данных на Xtest, Xtrain, Ytrain и Ytest без функции train_test_split в python - PullRequest
0 голосов
/ 05 февраля 2020

У меня есть набор данных с 80 столбцами. В python я хочу разделить данные на первые 60 как данные поезда и 13 как данные теста. Данные делятся случайным образом, если я использую функцию train_test_split. Я не хочу случайных данных для поезда.

Например: столбцы набора данных выглядят следующим образом:

Дата | variable_variable | independent_variable_1 | independent_variable_2

train = data[:80] 
test = data[13:]

Отсюда как разделить зависимую переменную и независимую переменную. (Xtrain, Xtest, Ytrain и Ytest) Заранее спасибо.

1 Ответ

0 голосов
/ 05 февраля 2020

Данные делятся случайным образом, если я использую функцию train_test_split. Я не хочу случайных данных для поезда.

По умолчанию это случайное, да, но вы можете сделать это НЕ случайным.

Если вы вызываете функцию, делая train_test_split(X, y, test_size=0.33, shuffle=False). Обратите внимание на параметр shuffle :

Независимо от того, нужно ли перетасовывать данные перед разбиением

Вы достигнете своей цели разделения без случайных разбиений.

Наконец, train_test_split разделяет строки набора данных с помощью test_size, поэтому, если вы хотите сделать это вручную, имейте в виду, что вы должны разбивать строки, а не столбцы, и сохраняйте соответствующие столбцы для X и Y .

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...