Регрессионный анализ для линейной регрессии - PullRequest
0 голосов
/ 05 марта 2019

У меня есть модель регрессии, в которой количественные значения моей целевой переменной (в днях) варьируются от 2 до 30. Моя RMSE равна 2,5, а все остальные X-переменные (номинальные) являются категориальными, и, следовательно, я их фиктивно закодировал.Я хочу знать, что было бы хорошим значением RMSE?Я хочу получить что-то в пределах 1-1,5 или даже меньше, но я не знаю, что мне нужно сделать, чтобы добиться того же.

Примечание # Я уже пробовал выбирать функции, и удаление функций будет иметь меньшее значение.

Любые идеи будут оценены.

1 Ответ

0 голосов
/ 05 марта 2019

Если ваши значения x являются категориальными, то необязательно иметь смысл связывать их с единой сеткой.Кто скажет, что категории A и B должны быть разнесены так же, как B и C. Предполагая, что они приведут только к неверному представлению ваших результатов.

Поскольку ваш выбор шкалы - неизвестные, вы былучше с точки зрения визуализации, чтобы установить вашу равномерную сетку x как номер дня, а затем увидеть, где категории будут располагаться по шкале y, если даны линейные отношения.

Ошибка RMS вообще не возникаетесли у вас нет количественных данных для х и у.

...