Я обучил основному DQN в игре OpenAI Gym CartPole. Теперь я хочу представить внешние события, чтобы...
точно так же, как и заголовок. мой код - простое Q-learning для блэкджека. но в обучающей части...
Я пытался решить среду OpenAI MountainCarContinuous-v0 некоторое время, но я застрял. Проведя...
Я использую тренажерный зал openai, чтобы сделать ИИ для блэкджека. но я плохо разбираюсь в питоне...
Следующий код взят из https://bair.berkeley.edu/blog/2018/01/09/ray/. import gym @ray.remote class...
В настоящее время я играю с базовыми линиями OpenAI и средами OpenAI Gym, чтобы разобраться в...
Я пытаюсь создать GIF-файл для среды Open AI Gym Taxi. Я могу видеть довольно много кодов для сред,...
Я запускаю программу обучения с подкреплением в тренажерном зале (BipedalWalker-v2), реализованную...
При использовании DQN, других алгоритмов глубокого RL, имеет ли смысл использовать сверточный слой...
Кроме документа openAI , мне не удалось найти более подробную документацию. Мне нужно знать...
код, приведенный ниже, показывает некоторую ошибку при выполнении этой части кода в агенте DQN. Я...
В настоящее время я запускаю редактор Spyder Python под Anaconda 3. Я следовал инструкциям по...
Вот общий вопрос, который, возможно, кто-то может указать мне в правильном направлении. Я вхожу в...
Разработка новой среды OpenAI GYM и агента keras-rl. Скажем, в начале есть 4 возможных действия...
Я создал код для реализации в политике контроля Монте-Карло по проблеме БлэкДжек из openAIgym в...
Я пытаюсь получить представление об обучении с подкреплением, используя тренажерный зал openAI в...
Я успешно установил свою настроенную среду, но как я могу ее обновить?Должен ли я просто запустить...
Для проекта я хочу тренировать «Humanoid-v2» для разных типов телосложения.Обычный Humanoid-v2...
Я тренировал «Humanoid-v2» (https://github.com/openai/gym/wiki/Humanoid-V1), чтобы ходить. Награды...
В настоящее время я работаю в агенте DQN с PyTorch, используя Space Invaders, однако у меня есть...
Я пытаюсь создать пользовательскую среду для обучения с подкреплением в тренажерном зале openAI.Мне...
benchmark = gym.benchmark_spec ('Atari40M') AttributeError: у объекта 'module' нет атрибута...
Я пытаюсь создать таблицу Q после этого сообщения в блоге , которое я нашел на Medium.com.В моей...
я клонировал https://github.com/Kautenja/gym-super-mario-brosи следуя учебникуиспользуя Ubuntu 16
Я пытаюсь выучить глубокое подкрепление с помощью OpenAI.Чтобы сделать это, я хочу переписать часть...