Что подразумевается под разработкой модели для прогнозирования целевой переменной, минимизирующей функцию «Root Mean Squared Error»? - PullRequest
0 голосов
/ 31 января 2020

Итак, это проблема регрессии, и я должен предсказать значения переменной. Что я не понимаю, так это то, что именно это означает, когда говорится «предсказать столбец« ab c », минимизируя функцию потерь« rmse »?

Я создал модель линейной регрессии и получил оценка 99,8. Это действительно так просто или я чего-то упускаю?

Означает ли это что-то еще, кроме простого показа root среднеквадратичной ошибки после того, как я получил предсказанную переменную?

Когда Я использую линейную регрессию, я получаю RMSE 2,467. И когда я использую Random Forest, я получаю RMSE 1,333.

Хороша ли моя модель или мне нужно сделать что-то еще, чтобы «минимизировать функцию RMSE»?

PS - я используя python для создания модели с помощью библиотеки sklearn.

1 Ответ

1 голос
/ 31 января 2020

Я думаю, вам больше повезет в перекрестной проверке: https://stats.stackexchange.com/

Однако в части программирования MSE или RMSE является мерой расстояния между предсказанными ценности и реальные ценности. Если вы используете алгоритм для прогнозирования величин, вы, возможно, захотите узнать, насколько вы были в своем прогнозе в отличие от реальных значений.

Основная цель - минимизировать это расстояние, то есть заставить вашу модель прогнозировать значения (y-hat), которые соответствуют или действительно близки к реальным (y), главным образом путем корректировки весов и параметров. Лучшее, что вы можете сделать для улучшения (понижения) RMSE, - это настройка гиперпараметров, это означает поиск оптимальных max_depth, n_features, min_sample_weight и других параметров для вашего RandomForrestRegressor, это когда вы решили придерживаться определенной модели регрессии (в данном случае RandomForrest кажется лучше, чем Linear Regression).

Наконец, определенное значение RMSE нельзя произвольно считать хорошим или плохим. Скажем, вы прогнозируете вес. Если вы работаете со слонами, RMSE из 1 может быть отлично, если это 1 миллиграмм , это может быть ужасно, если оно 1 тонна .

Это самое лучшее, что я могу поделиться с вами о RMSE, который соответствует области StackOverflow, как я уже упоминал ранее, для подробного объяснения и получения лучших ответов вам следует попробовать ссылку выше.

...