Question

Мне интересно, как пройти обучение нейронной сети, не предоставляя ей обучающие ценности. Моя предпосылка для этого заключается в том, что нейронные сети будут использоваться на роботе, который может получать положительные / отрицательные отзывы от датчиков. То есть, чтобы научить его свободно перемещаться, не сталкиваясь с предметами, возникает положительная обратная связь, когда не срабатывают датчики столкновения или датчики приближения. Отрицательная обратная связь возникает при срабатывании датчиков столкновения / приближения. Как обучить нейронную сеть, используя этот метод?

Я пишу это на C ++

Don Reba · Answer 1 · 26 января 2012

То, что вы описываете, называется обучением подкреплению. Это может быть применено к нейронным сетям, но не требует их вообще. Канонический учебник для чтения по этому предмету: Обучение усилению: Введение Ричарда Саттона и Эндрю Барто. Связь между нейронными сетями и обучением с подкреплением более подробно рассматривается в Руководстве по PDP , автором которого является Джеймс МакКлелланд.

phs · Answer 2 · 26 января 2012

Вы смотрели на SLAM ?Это техника, которую роботы могут использовать для навигации по области, одновременно создавая и сохраняя карту этой области.

Обучение нейронной сети без обучающих ценностей

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 2 ]

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Обучение нейронной сети без обучающих ценностей

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 2 ]

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Похожие темы