Правильный подход к модели машинного обучения для робототехники - PullRequest
1 голос
/ 22 января 2020

Я ищу отправную точку, какую модель или подход использовать. Дело в следующем:

Робот с 9 входами:

  • -6 датчиков, которые дают расстояние

  • - Датчик, который обнаруживает кратер sh

  • -Текущая скорость левого двигателя
  • -Текущая скорость правого двигателя

Выход: 2 цифры (или 2 логических значения) для управления 2-мя двигателями (вперед-вправо и вперед-вправо)

Теперь я думал о том, чтобы позволить роботу разобраться в своем пути, чтобы не взломать sh. Я подаю 6 датчиков вместе с одним «который работал / не работал» как данные в модель. Затем модель обучается выяснить, что, когда значение датчика ниже определенного числа, двигатель должен быть быстрее, чем другой чтобы избежать ввода cra sh. Кроме того, я должен сказать модели, что следует избегать флага cra sh.

Теперь, как платформа, я думал о Raspberry Pi, вероятно, с подключением azure, поэтому я могу использовать все, что угодно модель, которую я хочу

Но какую модель я ищу? Нужно учиться на постоянных данных. Попробуйте что-нибудь, напишите это обратно, поучитесь на этом, а затем попробуйте что-нибудь еще. Выходные данные должны быть мультирегрессионными или мультибинарными.

Вход также, несколько входов. Нужно учиться на новых точках уже. Есть идеи?

1 Ответ

2 голосов
/ 22 января 2020

Вы ищете обучение подкреплению . На нем много литературы, посвященной роботам или игровому ИИ. Как это работает, ну, как вы сказали, постоянно.

Он ( агент ) имеет окружение (датчики, текущие скорости), и он может выполнять действия (управление двигателями), которые приведут к на реакцию окружающей среды. С данным действием он получит награду, как distance from object < before => +1, иначе -1. Вы получаете смысл. Пытаясь потерпеть неудачу, он создаст свою собственную политику (свое поведение), которая максимизирует вознаграждение.

Наиболее используемый алгоритм в подкреплении: Q-Learning (его сторона глубокого обучения называется DQN).

Вот статья, которая может быть связана с вашей проблемой: ссылка

...