Я новичок в области обработки данных и пытаюсь понять разницу в прогнозе и фактических данных.
Допустим, у меня есть фактические данные:
27.580
25.950
0.000 (Sum = 53.53)
И мои прогнозируемые значения с использованием XGboost:
29.9
25.4
15.0 (Sum = 70.3)
Лучше просто оценить по сумме? пример добавить все действительные минус все предсказанные? Разница = 70,3 - 53,53?
Или лучше оценить разницу на основе методов прогнозирования ошибок, таких как MSE, MAE, RMSE, MAPE?
Так как, я читаю MAPE, является наиболее широко принятым,как это может быть реализовано в тех случаях, когда 0 является знаменателем, как видно из моих фактических данных выше?
Есть ли лучший способ оценить отклонение от фактических значений или это единственные допустимые методы? Моя цель - построить больше прогностических моделей с разными переменными, которые дадут мне разные прогнозируемые значения, а затем выбрать ту, которая имеет наименьшее отклонение от фактических значений.