Почему RL называется «подкреплением» обучения? - PullRequest
0 голосов
/ 28 мая 2018

Я понимаю, почему машинное обучение названо таковым, и вдобавок ко всему, номенклатура позади контролируемого и неконтролируемого обучения.Так что же такое усиленное в обучении подкреплению?

Ответы [ 2 ]

0 голосов
/ 28 мая 2018

Усиление обучения подкрепляется методом проб и ошибок.Результаты, которые являются неправильными (или менее чем оптимальными), не должны корректироваться вручную.Вместо этого основное внимание уделяется исследованию, и обратная связь (подкрепление) получается из этого же опыта.

0 голосов
/ 28 мая 2018

«Подкрепление» в обучении с подкреплением относится к тому, как определенные виды поведения поощряются, а другие - не поощряются.Поведения подкрепляются наградами, полученными благодаря опыту с окружающей средой.

...