Я использую фастай для решения проблемы регрессии. Примерно 1 миллион строк и 20 переменных шириной с несколькими факторными переменными, каждый из которых имеет более 20 тыс. Уровней фактора.
Я препроцессирую с нормализацией, вменением пропущенных значений и одним горячим кодированием для факторных переменных. Зависимая переменная колеблется от 6k до 60k.
RMSE ниже 200, а Mae около 90, но когда я использую формулу basi c MAPE в качестве метри c при обучении mape составляет около 87% ,
Что здесь происходит? Почему mape такой высокий, а MAE такой низкий?
MAPE формула:
np.mean(np.abs(
np.array(target) - np.array(pred)/np.array(target)))