Вопросы с тегом укрепление обучения - PullRequest

Вопросы с тегом укрепление обучения

0 голосов
2 ответов

Мой вопрос: почему, когда я тренирую один и тот же алгоритм дважды, он дает разные результаты...

J. Ali / 25 июня 2019
0 голосов
0 ответов

Я пытаюсь найти способ получить доступ к Unity Dr Learning, но не могу найти какую-либо информацию...

Mykhailo Melnychuk / 16 июня 2019
1 голос
1 ответ

Я знаю определение: - Оптимальная политика (pi) * удовлетворяет (pi) *> = (pi) для всех (pi)...

Naman Jain / 11 июня 2019
0 голосов
1 ответ

Я пытался определить диапазон каждой функции в среде Half Cheetah MuJoCo. Единственная релевантная...

soulless / 04 июня 2019
2 голосов
1 ответ

Я заинтересован в изучении подкрепления, в частности, как использовать RL для динамического...

dnobl / 26 мая 2019
0 голосов
1 ответ
0 голосов
0 ответов

Я пытаюсь реализовать Глубокий детерминистический градиент политики с помощью Keras. Вот алгоритм:...

Monocero / 28 апреля 2019
0 голосов
0 ответов

Я пытаюсь сбалансировать перевернутый маятник, используя алгоритм DDPG.Я не могу получить ожидаемые...

Shritej Chavan / 23 апреля 2019
0 голосов
1 ответ

Я новичок в области нейронных сетей, и я хочу понять определенное утверждение.Один мой друг сказал,...

Journerist / 18 апреля 2019
0 голосов
0 ответов
1 голос
0 ответов

У меня есть двумерный массив нормализованных данных. Я использую space = np.array([0,1,...366],[0,0

Karthik Rajkumar / 18 марта 2019
0 голосов
1 ответ

Когда я только начинал с подкрепляющего обучения, я поднял проблему с тележкой и следовал некоторым...

Aritro Mukherjee / 06 марта 2019
0 голосов
1 ответ

Я следовал учебному пособию Tensorflow , в котором реализован A3C, чтобы добиться успеха в среде...

memememe / 24 февраля 2019
0 голосов
1 ответ

Я хочу попробовать усиленное обучение на Python.Но я хочу создать пользовательскую среду с моими...

Savinay_ / 21 февраля 2019
0 голосов
1 ответ

Я пытался сделать ИИ для блэкджека, используя RL.Сейчас я пытаюсь сделать две отдельные сети, что...

seunghyung lee / 09 февраля 2019
0 голосов
1 ответ

привет, я пытался создать RL-программу для блэкджека.Я сделал весь код с Q-сети, и он работает

seunghyung lee / 04 февраля 2019
0 голосов
0 ответов

Я пытаюсь обучить DQNAgent с помощью типа action_space gym.spaces.Box (4).Но внутри функции...

Yaniv Sheffer / 31 января 2019
0 голосов
0 ответов

Я хотел бы представить новую функцию активации в сети с помощью tenorflow. Тем не менее, я получаю...

Yuay / 06 января 2019
0 голосов
1 ответ

Я хотел бы представить новый слой в качестве функции активации в тензорном потоке.Однако есть...

Yuay / 27 декабря 2018
0 голосов
1 ответ

Моя задача связана с большим типом среды мира сетки (размер сетки может быть 30x30, 50x50, 100x100,...

Mink / 06 декабря 2018
0 голосов
0 ответов

В настоящее время я использую базовый уровень PPO2 в OpenAI для разработки политики для нескольких...

user3259937 / 27 ноября 2018
0 голосов
1 ответ

Я пытаюсь реализовать память воспроизведения опыта с помощью tf.estimator.Estimator API.Однако я не...

Chocolate / 21 ноября 2018
0 голосов
0 ответов

Я использую a2c для работы на Cartpole-v1.Конечная цель - найти среднюю награду.Тем не менее, мое...

Wei Bovey / 14 ноября 2018
0 голосов
1 ответ

Я очень озадачен назначением библиотеки сонета DeepMind для TensorFlow. Насколько я могу судить из...

Sam Lerman / 04 ноября 2018
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...