Войти
Запомнить
Регистрация
PullRequest
Лента
Топ
Теги
Новая
Новая
Ankit Samal
 
11 ноября 2019
 
41
Как создать плотное вознаграждение в задаче RL? Какие-нибудь примеры, где это вообще невозможно?
0
голосов
Ankit Samal
/
11 ноября 2019
Учитывая, например, проблему с RL, робот поднимает объект. Как мы должны создавать плотные награды.
глубокое-изучение
армирование-обучения
Пожалуйста,
войдите
или
зарегистрируйтесь
чтобы ответить на этот вопрос.
Ответы [
0
]
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
Похожие темы
Глубокое усиленное обучение для обучения конфигурации с задержкой по времени
Шаг установки в Deep Q Network
Как проверить правильность обучения env?
Модель Keras: ошибка измерения формы ввода для агента RL
Какие существующие рамки существуют для автоматической навигации по координатам?
Не знаете, как приступить к созданию состояния наблюдения из данных, которые у меня есть для Deep Q Learning in Gym
Агент ЛР не предпринимает правильных действий, даже если есть возможность предпринять лучшие действия
Может ли кто-нибудь объяснить частично наблюдаемый марковский процесс принятия решений (POMDP) примером?
Усиление обучения: Actor-Criti c всегда лучше, чем метод градиента политики?
AlphaZero: какие узлы посещали во время самостоятельной игры?
...