Вопросы с тегом усиление обучения - PullRequest

Вопросы с тегом усиление обучения

0 голосов
0 ответов

Я недавно закончил кодировать свою собственную игру PACMAN, используя pygame и python 2.7, и сейчас...

Uri Yakir / 21 апреля 2019
0 голосов
0 ответов
0 голосов
0 ответов

RAY - библиотека RLLIB - оценка модели DQN с использованием автономных данных пакета. Модель не в...

narasimha.m / 16 апреля 2019
1 голос
0 ответов

Я пытаюсь преобразовать свой тензор потока кода в тензор потока. Проблема состоит в том, что прямой...

tk338 / 12 апреля 2019
0 голосов
0 ответов

Для моей дипломной работы в области компьютерных наук я реализовал алгоритм обучения подкреплению с...

Dennis Ziganow / 03 апреля 2019
2 голосов
1 ответ

В алгоритме итерации подходящего значения Эндрю Нга, который я подробно описал ниже, он попытается...

J0hnnyJiang / 01 апреля 2019
0 голосов
1 ответ

Я пытаюсь внедрить проксимальную оптимизацию политики и столкнулся с очень странной проблемой. Вот...

user2249675 / 29 марта 2019
2 голосов
0 ответов

Я не могу понять следующие шаги для моей Deep Q Network. Я пытаюсь оптимизировать автобусные...

Rayna Levy / 23 марта 2019
0 голосов
1 ответ

Я бы хотел построить автономный корабль в виртуальной среде с использованием DDPG . Однако проблема...

Dane Lee / 10 марта 2019
0 голосов
3 ответов

Мой вопрос связан не с реализацией обучения с подкреплением, а с пониманием концепции RL, когда...

maurocomi / 25 февраля 2019
0 голосов
0 ответов

Я обучил алгоритм на среде Carla, используя кластер Ray.Я хотел сделать вывод.Могу ли я знать, как...

Deepak Nayak / 22 февраля 2019
0 голосов
0 ответов

Мне известен этот хитрый способ реализации градиента политики (см. Его для справки: Обучение...

user1953737 / 22 февраля 2019
0 голосов
0 ответов

В идеале я хочу использовать нейронную сеть, используя метод глубокого обучения.Однако я не хочу...

Jostein Dyrseth / 19 февраля 2019
0 голосов
2 ответов

Я не могу обернуться вопросом: как именно отрицательные награды помогают машине избежать их?...

Anton Kasabutski / 19 февраля 2019
0 голосов
0 ответов

Представьте, что у меня проблема с динамическим ценообразованием, и я решаю эту проблему с помощью...

Karthik Rajkumar / 19 февраля 2019
0 голосов
0 ответов

Я изучаю градиент политики через игру CartPole.Я получил две реализации, и обе работают хорошо

dylc / 12 февраля 2019
0 голосов
0 ответов

Я хочу обучить политике, которая зависит от времени.Например, я хотел бы знать цену продукта с...

Tracy Yang / 08 февраля 2019
0 голосов
1 ответ
0 голосов
0 ответов

Я пытаюсь сделать так, чтобы компьютер выучил очень простую 2D игру-стрелялку с обучением...

Noam Vaknin / 23 января 2019
0 голосов
0 ответов

Я кодировал очень простую среду для стрелялки, в которой 2 игрока (квадраты) стреляют друг в друга...

Noam Vaknin / 23 января 2019
0 голосов
0 ответов
0 голосов
1 ответ

Существует обучение по подкреплению без какой-либо нейронной сети (например, Q-Learning), и есть...

Boun7yhun7er / 19 января 2019
0 голосов
1 ответ

У меня есть агент DQN, который обучен в определенной сети для выполнения задачи. Однако, когда я...

Abhijit Roy / 13 января 2019
0 голосов
1 ответ

Я пытался решить среду OpenAI MountainCarContinuous-v0 некоторое время, но я застрял. Проведя...

Sam Peterson / 13 января 2019
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...