Я использую бэкэнд-функцию Keras для вычисления градиента в обучении с подкреплением, и ниже...
Я новичок в машинном обучении и пытаюсь решить MountainCar-v0, используя Q-learning. Я могу решить...
Я пытаюсь установить Microsoft CNTK в среде анаконды. Я уже посмотрел документацию cntk , и, похоже...
Я пытаюсь запустить lunar_lander для подкрепления обучения, но когда я его запускаю, возникает...
Я планирую запустить алгоритм машинного обучения, который изучает значения узлов и веса ребер
Я хочу реализовать обучение подкрепления подключить четыре агента.Я не уверен, как это сделать и...
Какой лучший алгоритм для обучения подкреплению для игры в четыре на ряд. Я хочу построить игру...
Хотя я знаю, что SARSA находится вне политики, в то время как Q-learning вне политики, при взгляде...
Я знаю, что SVM предположительно являются «убийцами ANN» в том смысле, что они автоматически...
В настоящее время я пытаюсь заставить ANN играть в видеоигру, и я надеялся получить помощь от...
Все алгоритмы обучения с подкреплением , о которых я читал, обычно применяются к одному агенту с...
Я ищу идеи / опыт / ссылки / ключевые слова, касающиеся адаптивного управления параметрами из...
Я подумываю об использовании нейронной сети для питания моих врагов в космической стрелялке,...
В последнее время я много читал о Обучение усилению , и я нашел "Обучение усилению: Введение" как...