Я обучил агента RL, используя алгоритм DQN. После 20000 эпизодов мои награды сходятся. Теперь,...
В свободное время я изучаю «Обучение усилению» через книгу «Введение в обучение усилению - второе...
Ситуация: Я использую q-learning, и в обновлении значений Q есть что-то, чего я не понимаю: у меня...
Я настраиваю R-таблицу с (255 состояний, 4 действия).Как мне ввести его из R-таблицы (15, 15)? Я...
Фон У меня есть 3D-сцена, и я хочу дискретизировать ее пространство так, чтобы каждая координата (x...
Я моделирую систему управления запасами для розничного магазина; следовательно, у меня есть (15,15)...
Я заинтересован во внедрении Q-обучения (или некоторой формы обучения с подкреплением), чтобы найти...
Я беру урок Reinforcement Learning, и я не понимал, как совместить концепции итерации / итерации...