Войти

Запомнить

Регистрация

Лента
Топ
Теги
Новая

dark1sider 22 сентября 2018 17

Усиление обучения непрерывным действиям границ

0 голосов

dark1sider / 22 сентября 2018

Это код, который я обычно вижу mu, sigma = mu * A_BOUND [1], sigma + 1e-4.Но что, если моя граница будет [-240,240].Сигма не будет достаточно, чтобы действительно исследовать.Что делать в этом случае, я тоже умножу сигму?

tensorflow
глубокое изучение
укрепление обучения

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 0 ]

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.

Похожие темы

Введен новый слой с использованием tenorflow
Как изменить пример A3C Tensorflow, чтобы играть в игры Atari?
Глубокая модификация Q-обучения
Стратегия геологоразведочных работ DQN для крупной глобальной сети
Как я могу обновить тензор (значение веса), пытаясь использовать две отдельные сети?
Почему RL называется «подкреплением» обучения?
tenorflow Ошибка переменной: ошибка формы, хотя форма в порядке
Как использовать обученную политику в OpenAI Baseline
Усиление обучения для прогнозирования вращения между двумя изображениями
keras_rl: Как использовать агент DQN с action_space, отличным от Discrete (2)

...