Question

Я применил линейную регрессию к некоторым объектам, чтобы предсказать цель с 10-кратной перекрестной проверкой.
Была применена шкала MinMax как для объектов, так и для цели.
Затем стандартизированные функции.
Когда я запускаю модель, значение r2 равно 0,65, а MSE - 0,02.
Но когда я использую цель без масштабирования MinMax, я получаю то же значение r2, но MSE значительно увеличивается до 18 .
Мой вопрос заключается в том, должны ли мы иметь дело с целевыми объектами так же, как мы делаем с функциями в плане предварительной обработки данных? а какое из приведенных значений является правильным? потому что mse перестало быть масштабируемым без масштабирования цели.
Некоторые люди говорят, что мы тоже должны масштабировать цели, в то время как другие говорят нет.

Заранее спасибо.

roman_ka · Answer 1 · 07 февраля 2020

Независимо от того, масштабируете ли вы свою цель или нет, изменится «смысл» вашей ошибки. Например, рассмотрим 2 разные цели, одну в диапазоне [0, 100] и другую [0, 10000]. Если вы запускаете модели против них (без масштабирования), MSE 20 будет означать разные вещи для двух моделей. В первом случае это будет иметь катастрофические последствия, а во втором случае это будет довольно прилично.

Так что тот факт, что вы получаете более низкую MSE с целевым диапазоном [0, 1], чем оригинал, не удивителен.

В то же время значение r2 не зависит от диапазона, поскольку оно рассчитывается с использованием отклонений.

Масштабирование позволяет сравнивать производительность модели для разных целей.

Также для некоторых типов моделей (например, NN) масштабирование будет более важным.

Надеюсь, это поможет!

MinMax масштабирование цели

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

MinMax масштабирование цели

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Похожие темы