Является ли это предположение частью модели, также?
Да, это так.Идеи различных функций потерь вытекают из природы проблемы, а следовательно, из природы модели.
MSE
по определению вычисляет среднее значение квадратов ошибок (ошибка означает разницу между действительным y
и предсказанным y
), которое, в свою очередь, будет высоким, если данные равны не Распределение по типу Гаусса.Просто представьте несколько экстремальных значений среди данных, что произойдет с наклоном линии и, следовательно, с остаточной ошибкой?
![linear_regression_with_and_without_outlier](https://i.stack.imgur.com/If6vA.png)
Стоит упомянуть предположения о линейной регрессии:
- Линейные отношения
- Многомерная нормальность
- Нет или мала мультиколлинеарность
- Нет автокорреляции
- Гомоскедастичность
Если это не так, почему?Является ли она частью функции стоимости?
Насколько я видел, предположение не имеет прямого отношения к самой функции стоимости, а связано, как упоминалось выше, с самой моделью.
Например, идея машины опорных векторов - разделение классов.Это обнаружение линии / гиперплоскости (в многомерном пространстве, которая разделяет классы аутов), поэтому ее стоимостная функция составляет Потеря шарнира для «максимального запаса» классификации.С другой стороны, Логистическая регрессия использует Log-Loss (связано с кросс-энтропией), потому что модель является двоичной и работает с вероятностью выхода (0 или 1).И этот список можно продолжить ...