Вопросы с тегом д-обучение - PullRequest

Вопросы с тегом д-обучение

0 голосов
1 ответ

Я пытаюсь создать приложение на приборной панели в Python, чтобы имитировать проблему Q-Learning....

Pablo Ruiz Ruiz / 07 сентября 2018
0 голосов
1 ответ

Я пытаюсь реализовать приближение линейной функции для решения MountainCar с использованием...

ivallesp / 31 августа 2018
0 голосов
2 ответов

Я создал пользовательское подкрепление обучения environment и agent, которое похоже на игру в...

Kevin Fang / 02 июля 2018
0 голосов
1 ответ

В алгоритме Q-learning, используемом в Reinforcement Learning с воспроизведением, можно...

codroneci / 27 июня 2018
0 голосов
1 ответ

В недавних исследованиях по подкреплению знаний об играх Atari производительность агентов...

keisuke / 26 июня 2018
0 голосов
0 ответов

В настоящее время я думаю о создании TD (λ) для сети DQN.Я знаю, как реализовать, если это таблица...

Andy Wei / 12 июня 2018
0 голосов
2 ответов

Таким образом, в процессе обучения Q вы обновляете функцию Q следующим образом: Qnew (s, a) = Q (s,...

Andy Wei / 08 июня 2018
0 голосов
2 ответов

Я совсем новичок в обучении с подкреплением, поэтому могу ошибаться. Мои вопросы: Это уравнение...

anx199 / 29 мая 2018
0 голосов
2 ответов
0 голосов
1 ответ

Я пытаюсь дополнить симулятор упрощенной игры в блэкджек, который вернет лучшую политику в каждом...

Lucien Ledune / 18 мая 2018
0 голосов
1 ответ

Я только что внедрил Q-Learning без нейронных сетей, но я застрял в реализации их с помощью...

Finn Eggers / 17 мая 2018
0 голосов
1 ответ

Я должен создать свою собственную среду и применить алгоритм dqn в многоагентной среде. У меня 4...

Sa Na / 08 мая 2018
0 голосов
1 ответ
0 голосов
1 ответ

Я новичок в машинном обучении и пытаюсь решить MountainCar-v0, используя Q-learning. Я могу решить...

Jiahao Cai / 30 апреля 2018
0 голосов
3 ответов

Как люди справляются с проблемами, когда юридические действия в разных штатах различны?В моем...

Edmonds Karp / 25 апреля 2018
22 голосов
6 ответов

Я пытаюсь заставить агента учить движения мыши, необходимые для наилучшего выполнения какой-либо...

zergylord / 17 августа 2011
47 голосов
5 ответов

Хотя я знаю, что SARSA находится вне политики, в то время как Q-learning вне политики, при взгляде...

Ælex / 27 июля 2011
2 голосов
2 ответов

Как правильно обновить функцию R (s) во время Q-learning ?Например, скажем, агент посещает...

Cerin / 17 июля 2011
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...