Я использую метод обучения с глубоким подкреплением, чтобы перемещать агента от одной начальной точки к цели. На сцене есть и другие агенты и препятствия.
. Первая проблема заключается в том, что вводит нейронную сеть .
- это элементы, которые я знаю в начальной сцена:
- Позиция и начальная скорость для агента.
- Позиция для других агентов
- Положение препятствий
В других В некоторых случаях я читал, что входом в нейронную сеть является изображение (возможно, используются датчики), но в моем случае я не хочу использовать визуальные датчики.
2.Я обнаружил, что в алгоритмах обучения подкреплению набор данных не был предварительно создан, но мы моделируем данные во время обучения.
Я не нашел, как я могу создать набор данных, используя 3 элемента, которые я упомянул выше.
Может кто-нибудь помочь мне! Заранее спасибо !!!