Вопросы с тегом армирование обучение

0 голосов

1 ответ

InvalidArgumentError при использовании серверной функции Keras

Я использую бэкэнд-функцию Keras для вычисления градиента в обучении с подкреплением, и ниже...

thetna / 30 апреля 2018

0 голосов

1 ответ

Как инвариантное вознаграждение помогает обучению?

Я новичок в машинном обучении и пытаюсь решить MountainCar-v0, используя Q-learning. Я могу решить...

Jiahao Cai / 30 апреля 2018

0 голосов

0 ответов

Может ли быть способ установить cntk на архитектуру winx32?

Я пытаюсь установить Microsoft CNTK в среде анаконды. Я уже посмотрел документацию cntk , и, похоже...

Saeed Eltayeb / 27 апреля 2018

0 голосов

2 ответов

AttributeError: модуль '_Box2D' не имеет атрибута 'RAND_LIMIT_swigconstant'

Я пытаюсь запустить lunar_lander для подкрепления обучения, но когда я его запускаю, возникает...

HungryBird / 26 апреля 2018

3 голосов

2 ответов

Усиление обучения с neo4j: сделать 2 копии графа против хранить 2 копии всех значений на 1 графе

Я планирую запустить алгоритм машинного обучения, который изучает значения узлов и веса ребер

stackOverlord / 12 января 2012

3 голосов

1 ответ

Хотите реализовать подкрепление обучения подключить четыре агента

Я хочу реализовать обучение подкрепления подключить четыре агента.Я не уверен, как это сделать и...

Vadiklk / 10 января 2012

0 голосов

2 ответов

Лучший алгоритм обучения с подкреплением для игры в четыре

Какой лучший алгоритм для обучения подкреплению для игры в четыре на ряд. Я хочу построить игру...

Vadiklk / 08 января 2012

47 голосов

5 ответов

В чем разница между Q-learning и SARSA?

Хотя я знаю, что SARSA находится вне политики, в то время как Q-learning вне политики, при взгляде...

Ælex / 27 июля 2011

32 голосов

5 ответов

Когда я должен использовать машины опорных векторов, а не искусственные нейронные сети?

Я знаю, что SVM предположительно являются «убийцами ANN» в том смысле, что они автоматически...

zergylord / 15 июля 2011

129 голосов

7 ответов

Как обучить искусственную нейронную сеть играть в Diablo 2 с помощью визуального ввода?

В настоящее время я пытаюсь заставить ANN играть в видеоигру, и я надеялся получить помощь от...

zergylord / 01 июля 2011

11 голосов

2 ответов

Усиление обучения с переменными действиями

Все алгоритмы обучения с подкреплением , о которых я читал, обычно применяются к одному агенту с...

Cerin / 07 марта 2011

0 голосов

2 ответов

Поиск идей / ссылок / ключевых слов: адаптивное управление параметрами алгоритма поиска (онлайн-обучение)

Я ищу идеи / опыт / ссылки / ключевые слова, касающиеся адаптивного управления параметрами из...

sascha / 23 ноября 2010

5 голосов

4 ответов

Как использовать нейронные сети для решения «мягких» решений?

Я подумываю об использовании нейронной сети для питания моих врагов в космической стрелялке,...

RCIX / 25 октября 2009

7 голосов

5 ответов

Как запустить лисповский код Саттона и Бартона "Обучение усилению"?

В последнее время я много читал о Обучение усилению , и я нашел "Обучение усилению: Введение" как...

kaybenleroll / 10 февраля 2009