Вопросы с тегом армирование обучение - PullRequest

Вопросы с тегом армирование обучение

1 голос
1 ответ

Я читаю оригинальную бумагу PPO и пытаюсь сопоставить ее с входными параметрами модели...

PyRsquared / 21 июня 2019
2 голосов
1 ответ

Я работаю над изучением q-таблиц и пробежался по простой версии, в которой использовался только...

MNM / 21 июня 2019
1 голос
0 ответов

Я пробовал разные гиперпараметры и количество слоев и узлов, но моя модель ничего не изучает даже...

Himanshu Prajapati / 20 июня 2019
0 голосов
0 ответов

Я учусь изучению глубокого подкрепления, начиная с примеров из интернета по решению таких игр, как...

keithc / 18 июня 2019
0 голосов
1 ответ

Я понимаю эпсилон-жадный алгоритм, но есть одна путаница. Это среднее вознаграждение или значение ,...

AgnosticCucumber / 18 июня 2019
0 голосов
0 ответов

Извините за длинный пост, просто хотел заранее сообщить подробности реализации. Также, извините за...

page47250 / 17 июня 2019
1 голос
1 ответ

Я пытаюсь создать агента Deep Q-Network (DQN), который может научиться играть в игру 2048 .Я...

Drukob / 13 июня 2019
0 голосов
0 ответов

Я использую keras-rl и успешно запускаю пример keras-rl, а именно dqn_cartpole.py.Затем я изменяю...

LinTIna / 13 июня 2019
0 голосов
0 ответов

Я пытаюсь изменить среду FrozenLake для применения в моем простом проекте управления доходами,...

Makbule / 12 июня 2019
1 голос
1 ответ

Я пытался реализовать Actor Critic с помощью сверточной нейронной сети. Существует два разных...

nsidn98 / 11 июня 2019
2 голосов
1 ответ

Я хотел бы создать пользовательскую среду для занятий в тренажерном зале openai, которая имеет...

sesli / 10 июня 2019
0 голосов
1 ответ

Я пытаюсь понять, как использовать mdptoolbox и у меня есть несколько вопросов. Что означает 20 в...

Amanda / 08 июня 2019
0 голосов
0 ответов

Я бы хотел отслеживать свой прогресс в средах RL, таких как OpenAI, с течением времени. Я хотел бы,...

Sharan SP / 08 июня 2019
0 голосов
0 ответов
1 голос
2 ответов

Я использую метод глубокого обучения для прогнозирования поведения временных рядов.Я новичок в этом...

mad / 04 июня 2019
0 голосов
0 ответов

Я обучил модель A2C в Tensorflow 2.0 в среде CartPole-v0. Теперь я переключился на автомобильную...

twinrix / 04 июня 2019
0 голосов
0 ответов

Суть проблемы заключается в следующем: Существует набор функций, скажем, от f1 до fn, выводящих...

Vishnu Prasad K / 02 июня 2019
1 голос
0 ответов
1 голос
1 ответ

Я новичок в области обучения подкреплению.Так что я совершенно запутался с терминами «на основе...

antoine Mathu / 28 мая 2019
0 голосов
0 ответов

Openai Baselines сохранить обученную модель с помощью следующей команды, python -m baselines.run...

SD11 / 27 мая 2019
0 голосов
0 ответов

Я занимаюсь разработкой модели обучения подкреплению на R и хочу увеличить количество итераций...

Salem Gharbi / 25 мая 2019
0 голосов
0 ответов

Я новичок в машинном обучении и пробую один код, написанный на pong-v0.Я использую метод градиента...

Parikshit / 24 мая 2019
0 голосов
0 ответов

Я хотел бы использовать агента DQN, в котором у меня есть несколько непрерывных состояний (или...

Enrico Anderlini / 23 мая 2019
0 голосов
0 ответов
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...