Нужно ли удалять целевую переменную из данных в linearmodel.fit () Scikit-learn? - PullRequest
0 голосов
/ 22 апреля 2019

Документация Scikit-learn гласит, что у функции есть два аргумента: X (данные) и y (целевые значения). Удаляем ли мы целевую переменную из наших данных и предоставляем ее отдельно как y? Или мы сохраняем целевую переменную в X, а также предоставляем ее отдельно как y? Я сталкивался с обоими подходами, и мне было интересно, что было правильно.

Ответы [ 2 ]

3 голосов
/ 22 апреля 2019

X не должен содержать цель в качестве одного из столбцов. Если вы включите его, ваша линейная модель не выдаст ошибок кодирования , но для прогнозирования цели y она просто использует функцию y.

1 голос
/ 23 апреля 2019

Насколько я понимаю, вы не должны предсказывать завтрашнюю погоду по завтрашней погоде.Если вы уже знаете, что является правильным значением, прогнозировать его бессмысленно.

Однако вам не нужно удалять целевую переменную в вашем наборе данных, просто не включайте ее в свою ось X.

Что мы пытаемся сделать с прогнозной моделью?Основываясь на прошлых записях (и x, и y), мы обучили нашу модель находить их взаимосвязи.В будущем у нас может не быть y, но у нас все еще есть x в наших руках, предполагая, что их отношения не меняются, мы предсказываем, каков y для будущего.

...