Question

Я использую метод обучения с глубоким подкреплением, чтобы перемещать агента от одной начальной точки к цели. На сцене есть и другие агенты и препятствия.

. Первая проблема заключается в том, что вводит нейронную сеть .

- это элементы, которые я знаю в начальной сцена:

Позиция и начальная скорость для агента.
Позиция для других агентов
Положение препятствий

В других В некоторых случаях я читал, что входом в нейронную сеть является изображение (возможно, используются датчики), но в моем случае я не хочу использовать визуальные датчики.

2.Я обнаружил, что в алгоритмах обучения подкреплению набор данных не был предварительно создан, но мы моделируем данные во время обучения.

Я не нашел, как я могу создать набор данных, используя 3 элемента, которые я упомянул выше.

Может кто-нибудь помочь мне! Заранее спасибо !!!

Глубокое обучение

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 0 ]

Глубокое обучение

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 0 ]

Похожие темы