Я работаю над анализом и прогнозированием фондового рынка с использованием методов машинного...
точно так же, как и заголовок. мой код - простое Q-learning для блэкджека. но в обучающей части...
Я использую тренажерный зал openai, чтобы сделать ИИ для блэкджека. но я плохо разбираюсь в питоне...
Я занимаюсь исследованием проблемы решения с конечным горизонтом с t = 1, ..., 40 периодами. На...
Я использую keras для построения DQN и обучения его классическому алгоритму DQN с памятью...
При использовании DQN, других алгоритмов глубокого RL, имеет ли смысл использовать сверточный слой...
Кроме документа openAI , мне не удалось найти более подробную документацию. Мне нужно знать...
Я пытаюсь написать агента DDPG, чтобы играть в футбольную игру в pytorch.Первоначально с агентом...
Вот общий вопрос, который, возможно, кто-то может указать мне в правильном направлении. Я вхожу в...
Было странно, когда я сталкиваюсь с этим в обучении подкреплению.Потеря MSE.Все должно быть...
Я создал код для реализации в политике контроля Монте-Карло по проблеме БлэкДжек из openAIgym в...
Я пытаюсь получить представление об обучении с подкреплением, используя тренажерный зал openAI в...
Я пытаюсь использовать тензор потока для создания агента DQN.Я черпаю вдохновение из этого...
Я пытаюсь реализовать DDPG в Tensorflow.Пространство действия непрерывно с верхней границей P_max и...
Код, используемый для инициации MonitoredTrainingSession, вызывает InvalidArgumentError: with tf
У меня есть одно сомнение, связанное с итерацией значения.Я пытался решить проблему...
Эта реализация PPO где-то содержит ошибку, и я не могу понять, что не так.Сеть возвращает...
, поэтому я уверен, что все слышали о вызове Беркли Pac-Man AI в тот или иной момент.Некоторое время...
Для проекта я хочу тренировать «Humanoid-v2» для разных типов телосложения.Обычный Humanoid-v2...
Я тренировал «Humanoid-v2» (https://github.com/openai/gym/wiki/Humanoid-V1), чтобы ходить. Награды...
Я хочу тренировать ИИ с использованием Reinforcement Learning на python.Цель состоит в том, чтобы...
Я пытаюсь создать пользовательскую среду для обучения с подкреплением в тренажерном зале openAI.Мне...
Привет, сообщество переполнения стека! В настоящее время я слежу за лекциями Дэвида Сильвера по...
Я видел много постов, которые визуализируют улучшение агента подкрепления в процессе обучения
benchmark = gym.benchmark_spec ('Atari40M') AttributeError: у объекта 'module' нет атрибута...