Я работаю над проектом, в котором мне нужно найти оптимальный оптимизированный путь от 1 точки к...
Я читаю оригинальную бумагу PPO и пытаюсь сопоставить ее с входными параметрами модели...
Я работаю над изучением q-таблиц и пробежался по простой версии, в которой использовался только...
Я пробовал разные гиперпараметры и количество слоев и узлов, но моя модель ничего не изучает даже...
Я учусь изучению глубокого подкрепления, начиная с примеров из интернета по решению таких игр, как...
Я понимаю эпсилон-жадный алгоритм, но есть одна путаница. Это среднее вознаграждение или значение ,...
Извините за длинный пост, просто хотел заранее сообщить подробности реализации. Также, извините за...
Я пытаюсь создать агента Deep Q-Network (DQN), который может научиться играть в игру 2048 .Я...
Я использую keras-rl и успешно запускаю пример keras-rl, а именно dqn_cartpole.py.Затем я изменяю...
Я пытаюсь изменить среду FrozenLake для применения в моем простом проекте управления доходами,...
Я пытался реализовать Actor Critic с помощью сверточной нейронной сети. Существует два разных...
Я хотел бы создать пользовательскую среду для занятий в тренажерном зале openai, которая имеет...
Я пытаюсь понять, как использовать mdptoolbox и у меня есть несколько вопросов. Что означает 20 в...
Я бы хотел отслеживать свой прогресс в средах RL, таких как OpenAI, с течением времени. Я хотел бы,...
Я хотел бы использовать train_opt = tf.train.AdamOptimizer().minimize() для проблемы, когда потеря...
Я использую метод глубокого обучения для прогнозирования поведения временных рядов.Я новичок в этом...
Я обучил модель A2C в Tensorflow 2.0 в среде CartPole-v0. Теперь я переключился на автомобильную...
Суть проблемы заключается в следующем: Существует набор функций, скажем, от f1 до fn, выводящих...
Я просто пытаюсь выполнить этот простой пробный код: import gym env = gym
Я новичок в области обучения подкреплению.Так что я совершенно запутался с терминами «на основе...
Openai Baselines сохранить обученную модель с помощью следующей команды, python -m baselines.run...
Я занимаюсь разработкой модели обучения подкреплению на R и хочу увеличить количество итераций...
Я новичок в машинном обучении и пробую один код, написанный на pong-v0.Я использую метод градиента...
Я хотел бы использовать агента DQN, в котором у меня есть несколько непрерывных состояний (или...
Я пытаюсь создать модель обучения с подкреплением для оценки компании, основываясь на финансовых...