Моя проблема заключается в следующем.У меня есть простой мир сетки: https://i.imgur.com/2QyetBg.png...
Я относительно новичок в понятиях машинного обучения, и я читал несколько лекций / учебных пособий...
Я работаю над проектом с кодом Keras Plays Catch .Я изменил игру на простую игру «Змея» и...
Я пытаюсь реализовать градиент политики для проблемы контекстного бандита (https://medium
Таким образом, последний поток, который я написал о Reinforcement Learning, был отмечен как слишком...
в следующем коде, который является кодом для решения FrozenLake 4x4 с помощью Q-learning. в...
Я тренирую агента с DQN. Награда увеличивается, а убыток уменьшается. Это хороший знак, у меня...
Я выполняю задание Deep-Q Learning, и у меня есть последовательность из 4 изображений, которые я...
Я хочу тренировать ИИ с использованием Reinforcement Learning на python.Цель состоит в том, чтобы...
Привет, сообщество переполнения стека! В настоящее время я слежу за лекциями Дэвида Сильвера по...
В контексте сетей Double Q или Deuling Q, я не уверен, полностью ли я понимаю разницу.Особенно с V....
Если агент Q-Learning действительно заметно лучше противостоит противникам в конкретной карточной...
Я пытаюсь реализовать опыт воспроизведения (ER) в среде OpenAI taxi-v2.Предполагается, что...
Я играю с pymdptoolbox.У него есть встроенная проблема управления лесами.Он может генерировать...
Я написал реализацию Q-Learning для решения проблемы OpenAI FrozenLake-v0 с использованием простого...
У меня проблемы с FQL (Fuzzy Q-Learning). Я реализовал свой алгоритм на Matlab. На самом деле...
Я понимаю, что эпсилон отмечает компромисс между разведкой и эксплуатацией. Сначала вы хотите,...
Здравствуйте, я работаю над полным контролем над проблемой с карполом (перевернутый маятник). Моя...
Я пытался реализовать алгоритмы q-learning в Керасе.По статьям я нашел эти строки кода. for state,...
Я новичок в области обучения усилению (RL) и Q-обучения в частности. У меня есть набор из 20 штатов...
Я недавно изучал изучение подкрепления.Для этого я читал знаменитую книгу Саттона, но есть кое-что,...
Я пытаюсь реализовать DQN и DDQN (оба с опытом ответа) для решения OpenAI AI-Gym Cartpole...
У меня есть вопрос о моем собственном проекте по тестированию техники подкрепления.Сначала...
Я хочу создать агент градиента политики, который сможет играть в Doom с помощью этого руководства
Я пытался создать DQN для игр Atari в Tensorflow. Вот мой код: import tensorflow as tf import gym...