Как справиться с изменением номеров элементов ввода и множественными действиями в обучении с подкреплением? - PullRequest
0 голосов
/ 05 мая 2020

Привет Уважаемые участники группы. У меня есть запрос, связанный с RL. Пожалуйста, помогите мне указать правильное направление. Я новичок в RL, и поэтому мой вопрос может показаться глупым, поэтому, пожалуйста, потерпите меня. Допустим, например, задача состоит в том, чтобы расположить n элементов на холсте. Действие, которое можно применить к каждому элементу, является двухмерным [перемещение вверх / вниз, перемещение влево / вправо]. У агента есть ограничение по времени, чтобы завершить sh задание, и как только время истечет, он получит награду, если все устроено правильно. Следующая задача снова будет такой же, но количество элементов и размеры холста могут измениться. Как справиться с этим сценарием с использованием RL, поскольку количество действий будет меняться по мере того, как количество элементов будет меняться от одной задачи к другой

1 Ответ

0 голосов
/ 06 мая 2020

Один метод, который вы могли бы рассмотреть в зависимости от деталей вашей игры. Если у каждого элемента одна и та же цель и одни и те же действия, вы можете обучить агента, который решает для одного элемента, достигающего цели. После обучения вы можете добавлять дополнительные элементы и передавать каждый элемент по сети, чтобы получить действие для каждого элемента. Мы реализовали нечто очень похожее. Прелесть в том, что вам нужно тренироваться только с одним элементом, что делает его намного быстрее. Также после обучения у вас может быть любое количество элементов, и агент сможет решить это так же легко, как если бы был один элемент. Все зависит от деталей вашей игры и от того, чего вы хотите достичь.

...