Мне интересно, как пройти обучение нейронной сети, не предоставляя ей обучающие ценности. Моя предпосылка для этого заключается в том, что нейронные сети будут использоваться на роботе, который может получать положительные / отрицательные отзывы от датчиков. То есть, чтобы научить его свободно перемещаться, не сталкиваясь с предметами, возникает положительная обратная связь, когда не срабатывают датчики столкновения или датчики приближения. Отрицательная обратная связь возникает при срабатывании датчиков столкновения / приближения. Как обучить нейронную сеть, используя этот метод?
Я пишу это на C ++