Влияет ли порядок ввода на результат модели регрессии? - PullRequest
0 голосов
/ 16 октября 2019

У меня есть X и y для обучения модели.

X имеет входные данные x1, x2, x3, x4.

И я использую эту модель для прогнозирования новых данных new_X.

но входные данные в new_X: x3, x2, x1, x4.

X и X_new - это фреймы данных со многими функциями.

Повлияет ли порядок столбцов на результат модели?

Например: model.predict_proba (new_X)

x1  x2  x3
-----------
2   2   3
0   1   4
3   4   0
5   5   5

x3  x1  x2
-----------
2   2   3
0   1   4
3   4   0
5   5   5

1 Ответ

0 голосов
/ 16 октября 2019

Краткий ответ: ДА


Длинный ответ:

Если переменные x1,x2,x3,x4 в X представляют одно и то жевещи как переменные x3,x2,x1,x4 в X-new, тогда да .

Причина проста. Подумайте о следующем. Допустим, x1 - это возраст некоторых людей. Вы обучаете модель, а затем у вас есть weight (w) для этой переменной.

Далее, если вы попытаетесь предсказать X_new, будет использоваться этот обученный weight. Но теперь оно будет применено к другой переменной (т.е. x3, а не x1).

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...