Я думаю, вам больше повезет в перекрестной проверке: https://stats.stackexchange.com/
Однако в части программирования MSE
или RMSE
является мерой расстояния между предсказанными ценности и реальные ценности. Если вы используете алгоритм для прогнозирования величин, вы, возможно, захотите узнать, насколько вы были в своем прогнозе в отличие от реальных значений.
Основная цель - минимизировать это расстояние, то есть заставить вашу модель прогнозировать значения (y-hat), которые соответствуют или действительно близки к реальным (y), главным образом путем корректировки весов и параметров. Лучшее, что вы можете сделать для улучшения (понижения) RMSE
, - это настройка гиперпараметров, это означает поиск оптимальных max_depth
, n_features
, min_sample_weight
и других параметров для вашего RandomForrestRegressor
, это когда вы решили придерживаться определенной модели регрессии (в данном случае RandomForrest
кажется лучше, чем Linear Regression
).
Наконец, определенное значение RMSE
нельзя произвольно считать хорошим или плохим. Скажем, вы прогнозируете вес. Если вы работаете со слонами, RMSE
из 1 может быть отлично, если это 1 миллиграмм , это может быть ужасно, если оно 1 тонна .
Это самое лучшее, что я могу поделиться с вами о RMSE
, который соответствует области StackOverflow, как я уже упоминал ранее, для подробного объяснения и получения лучших ответов вам следует попробовать ссылку выше.