Я читаю о машинном обучении и пытаюсь понять, что означает смещение и дисперсия.Я читал эти статьи ( 1 , 2 , 3 ), но все еще есть несколько вопросов:
Смещение:
модель смещена в том смысле, что она предполагает, что данные будут вести себя определенным образом (линейный, квадратичный и т. Д.), Даже если это предположение может быть неверным
Что значит «предполагать»?Мы выбираем модель, которую хотим использовать.Если мы выберем линейную модель, то она будет пытаться соответствовать лучшей из возможных линий.
Дисперсия:
Дисперсия показывает, насколько противоречивы прогнозы издруг друга на разных тренировочных наборах
Почему это должно быть согласованно, если мы используем разные тренировочные наборы?Если мы будем использовать данные о кошках, это даст один прогноз.Если мы будем использовать данные о собаках, это даст нам разные прогнозы.Или они означают, что когда мы добавим больше наблюдений в наш обучающий набор, прогнозы должны улучшиться, и разве эта модель теперь не дает нам другого прогноза, чем раньше?