Я работаю над гоночной игрой, в которой используется обучение с подкреплением. При обучении модели...
Когда модель обучения обучению с подкреплением, В момент времени t существует состояние S (t) и...
Я не уверен, возможно ли это в Tensorflow, и я обеспокоен тем, что мне, возможно, придется...
Я выполняю задание Deep-Q Learning, и у меня есть последовательность из 4 изображений, которые я...
Для проекта, над которым я работаю, я стремлюсь прогнозировать рыночные тренды и в результате...
В настоящее время я использую Keras (серверную часть Tensorflow) для написания агента обучения...
Я пытаюсь построить нейронную сеть для вывода вероятностного распределения по множеству всего...
Я узнаю о подходе, применяемом в обучении армированию для робототехники, и натолкнулся на концепцию...
Я понимаю, что эпсилон отмечает компромисс между разведкой и эксплуатацией. Сначала вы хотите,...
Я новичок в области обучения усилению (RL) и Q-обучения в частности. У меня есть набор из 20 штатов...
У меня проблема с отправкой N агентов из исходной вершины 'src' в конечную вершину 'dst'...
x = tf.Placeholder(shape=[1,31,5,1]) def func(x): operations... return output convolutionFunction =...
Я внедряю сеть Deep Q (с фиксированной целью Q), для которой требуется назначить параметры из сети...
Я создал пользовательское подкрепление обучения environment и agent, которое похоже на игру в...
Я пытаюсь понять проблему многорукого бандита, используя python.Я продолжаю сталкиваться с частями...
В чем разница между обучением с подкреплением, глубоким обучением и обучением с глубоким...
Я изучал подкрепляющее обучение и понимаю концепции итерации «ценность / политика», TD (1) / TD (0)...
В статье OpenAI "Стратегии развития как масштабируемая альтернатива обучению в области...
В настоящее время работает над алгоритмом подкрепления с использованием Q-таблиц и графики черепах
В настоящее время пытаюсь реализовать алгоритм Q-таблицы в моей среде, созданной с использованием...
Я должен создать свою собственную среду и применить алгоритм dqn в многоагентной среде. У меня 4...
Как люди справляются с проблемами, когда юридические действия в разных штатах различны?В моем...
У меня есть ИИ, который хорошо играет в Connect 4 (используя минимакс).Теперь я хочу использовать...
Я только что закончил писать некоторый код, который запускает нейронную сеть прямого обучения. Я...
Я пытаюсь заставить агента учить движения мыши, необходимые для наилучшего выполнения какой-либо...