При размещении параметров для train_test_split()
меня смущает вопрос о том, стоит ли указывать матрицу проектирования моих точек x-данных или матрицу, которая содержит только исходные точки x-data. Они оба работают и не выдают никаких ошибок, однако, какую из них следует использовать при выполнении разделения обучения / тестирования?
(xcoord - исходные данные, а X - матрица проектирования)
т.е.:
X_train, X_test, y_train, y_test = train_test_split(xcoord, ydata, test_size=0.80)
против
X_train, X_test, y_train, y_test = train_test_split(X, ydata, test_size=0.80)
Кроме того, в чем разница, если таковая имеется?