Привет Уважаемые участники группы. У меня есть запрос, связанный с RL. Пожалуйста, помогите мне указать правильное направление. Я новичок в RL, и поэтому мой вопрос может показаться глупым, поэтому, пожалуйста, потерпите меня. Допустим, например, задача состоит в том, чтобы расположить n элементов на холсте. Действие, которое можно применить к каждому элементу, является двухмерным [перемещение вверх / вниз, перемещение влево / вправо]. У агента есть ограничение по времени, чтобы завершить sh задание, и как только время истечет, он получит награду, если все устроено правильно. Следующая задача снова будет такой же, но количество элементов и размеры холста могут измениться. Как справиться с этим сценарием с использованием RL, поскольку количество действий будет меняться по мере того, как количество элементов будет меняться от одной задачи к другой