Обучение нейронной сети без обучающих ценностей - PullRequest
2 голосов
/ 26 января 2012

Мне интересно, как пройти обучение нейронной сети, не предоставляя ей обучающие ценности. Моя предпосылка для этого заключается в том, что нейронные сети будут использоваться на роботе, который может получать положительные / отрицательные отзывы от датчиков. То есть, чтобы научить его свободно перемещаться, не сталкиваясь с предметами, возникает положительная обратная связь, когда не срабатывают датчики столкновения или датчики приближения. Отрицательная обратная связь возникает при срабатывании датчиков столкновения / приближения. Как обучить нейронную сеть, используя этот метод?

Я пишу это на C ++

Ответы [ 2 ]

5 голосов
/ 26 января 2012

То, что вы описываете, называется обучением подкреплению. Это может быть применено к нейронным сетям, но не требует их вообще. Канонический учебник для чтения по этому предмету: Обучение усилению: Введение Ричарда Саттона и Эндрю Барто. Связь между нейронными сетями и обучением с подкреплением более подробно рассматривается в Руководстве по PDP , автором которого является Джеймс МакКлелланд.

1 голос
/ 26 января 2012

Вы смотрели на SLAM ?Это техника, которую роботы могут использовать для навигации по области, одновременно создавая и сохраняя карту этой области.

...