Использовать ли исходную матрицу точек x-data или матрицу проектирования при вводе параметров для train_test_split в numpy? - PullRequest
2 голосов
/ 09 марта 2020

При размещении параметров для train_test_split() меня смущает вопрос о том, стоит ли указывать матрицу проектирования моих точек x-данных или матрицу, которая содержит только исходные точки x-data. Они оба работают и не выдают никаких ошибок, однако, какую из них следует использовать при выполнении разделения обучения / тестирования?

(xcoord - исходные данные, а X - матрица проектирования)

т.е.:

X_train, X_test, y_train, y_test = train_test_split(xcoord, ydata, test_size=0.80)

против

X_train, X_test, y_train, y_test = train_test_split(X, ydata, test_size=0.80)

Кроме того, в чем разница, если таковая имеется?

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...