Измерение смещения модели машинного обучения - PullRequest
0 голосов
/ 13 апреля 2020

Как мы можем измерить смещение модели машинного обучения? Можем ли мы определить его, просто рассчитав разницу в оценках производительности на данных поезда и данных испытаний? Например, если модель SVM прогнозирует, что для данных о поездах установлено значение 0,53, а затем для данных испытаний - 0,60; Можем ли мы сказать, что смещение составляет всего 7 баллов?

Я читал статью, в которой упоминалось, что «Уклон метода проверки модели часто измеряется с точки зрения разницы между оценкой производительности, полученной из методика проверки модели и производительность модели на невидимых данных. " Диаграмма об этом здесь

Спасибо

1 Ответ

0 голосов
/ 16 апреля 2020

Что касается последнего вопроса в комментариях, я думаю, что вы имеете в виду другие случаи смещения и дисперсии.

В области статистики смещение относится к смещению ( систематическая c ошибка) в прогнозе или оценщике.

В области нейронных сетей ошибка смещения относится к разнице ваших train error и наилучших возможных error.

При обучении нейронной сети вы демонстрируете модели несколько примеров для изучения (набор обучений) и примеры не для изучения, а для измерения производительности (набор проверки или также называется набором dev). Разница между train error и validation/dev error называется variance и дает вам представление о том, насколько хорошо ваша модель обобщается на невидимые данные.

Поскольку вы, вероятно, будете обучать несколько моделей, пока не будете удовлетворены Результаты, вы выберете лучший, основываясь на validation/dev error. Это может включать в себя какое-то переопределение для гиперпараметров, поскольку вы сохраняете модели с максимальной производительностью только в validation/dev error.

. Вы можете использовать третий набор, называемый тестовым набором невидимых примеров, а не учиться у них. Если validation/dev error очень похож на test error, то (как правило) вы можете сделать вывод, что ваша модель не имеет наложения на гиперпараметры и должна работать так же хорошо, как в вашем наборе разработчиков.

Опять же, я Настоятельно рекомендуем вам посмотреть это видео для получения более подробной информации.

Надеюсь, это поможет!

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...