Почему небольшой набор данных имеет высокую дисперсию? - PullRequest
0 голосов
/ 02 июля 2019

Почему небольшой набор данных имеет высокую дисперсию? Наш профессор однажды сказал это. Я просто не понял этого. Любая помощь будет принята с благодарностью.

Заранее спасибо.

1 Ответ

0 голосов
/ 02 июля 2019

Каждый из нас, когда мы начинаем свою профессиональную карьеру, сталкивался с большим набором визуальных данных, чем с самым большим набором данных, доступным для исследователей ИИ. Кроме того, у нас есть данные о звуке, запахе, осязании и вкусе, поступающие от наших внешних органов чувств. Таким образом, люди имеют много контекста в человеческом мире. У нас есть общее здравое понимание человеческих ситуаций. При анализе набора данных мы объединяем сами данные с нашими прошлыми знаниями, чтобы провести анализ.

Типичный алгоритм машинного обучения не имеет ничего подобного - он содержит только те данные, которые вы ему показываете, и эти данные должны быть в стандартизированном формате. Если шаблон не присутствует в данных, алгоритм не сможет его изучить. Вот почему при наличии небольшого набора данных он более подвержен ошибкам.

...