Существуют различные метрики оценки для проблем регрессии, как показано ниже.
- Средняя квадратическая ошибка (MSE)
- Root -Средняя квадратичная ошибка (RMSE)
- Средняя абсолютная ошибка (MAE)
- R² или Коэффициент определения
- Среднеквадратичная ошибка (MSPE)
- и т. Д.
Как вы упомянули, вам нужно использовать их в зависимости от типа вашей проблемы, того, что вы хотите измерить, и распределения ваших данных.
- Для этого вам необходимо понять, как эти метрики оценивают модель. Вы можете проверить определения и плюсы / минусы показателей оценки из этого приятного сообщения в блоге .
R²
показывает, какая вариация вашей целевой переменной описывается независимыми переменными. Хорошая модель может дать R²
балл, близкий к 1,0, но это не значит, что так и должно быть. Модели с низким R²
также могут давать низкий MSE
балл. Таким образом, для обеспечения предсказательной силы вашей модели лучше использовать MSE
, RMSE
или другие метрики, кроме R²
. - Нет. Вы можете использовать несколько показателей оценки. Важно, если вы сравниваете две модели, вам нужно использовать один и тот же набор тестовых данных и одни и те же метрики оценки.
- Например, если вы хотите слишком сильно оштрафовать свои неверные прогнозы, вы можете использовать
MSE
оценочный показатель c, потому что он в основном измеряет среднюю квадрат ошибку наших прогнозов или если ваши данные имеют слишком много выбросов MSE
слишком много штрафуют за эти примеры. - Хорошее определение модели изменяется в зависимости от сложности вашей проблемы. Например, если вы тренируете модель, которая предсказывает, что голова или хвост и дает точность% 49, это не достаточно хорошо, потому что базовый уровень этой проблемы составляет% 50. Но для любой другой проблемы точности% 49 может быть достаточно для вашей проблемы. Таким образом, в итоге, это зависит от вашей проблемы, и вам нужно определить или подумать, что человеческий (базовый) порог.