Я обучаю агента обучения подкреплению, используя openAI stable-baselines . Я также оптимизирую...
Я хотел бы создать пользовательскую среду для занятий в тренажерном зале openai, которая имеет...
Я исследовал множество роботизированных сред, разработанных в тренажерном зале OpenAI. https://gym
Я использую vizdoom 1.1.7 в google colab. Для создания среды я использую файл basic.cfg. Но...
Я успешно установил тренажерный зал, но при создании среды atari результат очень странный, он...
Я хотел бы изменить Taxi V2-Environment в Open AI Gym. Можно ли забрать 2 пассажиров, прежде чем я...
В настоящее время я работаю над пользовательской средой Gym, которая представляет сетевой график (с...
Можно ли запустить тренажерный зал OpenAI (точнее, car_racing) в док-контейнере, используя...
Я пытался определить диапазон каждой функции в среде Half Cheetah MuJoCo. Единственная релевантная...
Изучение серии уроков OpenAi "Spinning Up" (https://spinningup.openai
Вызов env.render () всегда отображает окна, заполняющие весь экран. env = gym
Прежде всего, я пытаюсь сгенерировать образы среды симуляции OpenAI Gym. Я получаю 128 x 128 x 3...
Я пытаюсь изучать Q-Learning, используя тренажерный модуль OpenAI. Но когда я пытаюсь...
Я просто пытаюсь выполнить этот простой пробный код: import gym env = gym
Недавно я сравнил две модели для DQN в среде CartPole-v0. Один из них представляет собой...
Openai Baselines сохранить обученную модель с помощью следующей команды, python -m baselines.run...
Я пытаюсь решить проблему CartPole-v1 из OpenAI, используя backprop в однослойной нейронной сети -...
Я использую несколько семян для инициализации OpenAI условий в тренажерном зале, так как я хочу...
Используйте gym_soccer в качестве примера, когда я импортирую gym_soccer, это завернутый ENV.Классы...
Программа имеет ошибку сегментации при использовании последовательной модели keras, по крайней мере...
Я играю в тренажерном зале OpenAI и просто обновляю tenorflow 1.13 до тензорного потока 1.8. Я...
Я использовал OpenAI для обучения модели DeepQ. После выполнения saver = tf.train.Saver() saver
Я попытался использовать непрерывное пространство действия DDPG для решения следующей проблемы...
Я столкнулся с проблемой RL, которая использует пакет Box2D, и я хочу сделать некоторые вычисления,...
Могу ли я получить состояние рендеринга камеры с точки зрения глаз агента (в качестве визуальных...