Я реализую алгоритм множественной регрессии и случайный лес, чтобы прогнозировать зарплаты игроков NBA. Я использовал проектирование объектов с помощью тепловых карт VIF и Pearson, чтобы выбрать свои функции.
Среднее значение заработной платы NBA составляет 7 миллионов, а среднеквадратичная ошибка Root, которую я получаю из этой модели:
6,2 миллиона для кратного и 6,04 миллиона для случайного леса. Диапазон зарплат составляет 0-38 млн.
Я хочу определить показатели успеха в этой модели. Я предполагаю, что RSME и R-квадрат являются действительными показателями для оценки модели.
Я не совсем понимаю, как интерпретировать значения RMSE и R-квадрат, полученные из моих моделей. Мой квадрат составляет .48 и .49 соответственно для двух моделей.
Является ли этот RMSE относительно хорошим и как его интерпретировать? Есть ли другие метрики оценки, на которые я должен обратить внимание?