Вопросы с тегом усиление обучение

0 голосов

1 ответ

Добавьте слой LSTM после слоев Conv2D и добавьте некоторые другие входные данные

Я работаю над гоночной игрой, в которой используется обучение с подкреплением. При обучении модели...

Kalum Dushantha / 12 января 2019

0 голосов

0 ответов

Усиление обучения - действие, выбранное в момент времени t, будет влиять на время t + 1

Когда модель обучения обучению с подкреплением, В момент времени t существует состояние S (t) и...

Z8H92 / 04 января 2019

0 голосов

1 ответ

Tensorflow: Как скопировать весовые коэффициенты конвульного слоя в другую переменную для использования в обучении с подкреплением?

Я не уверен, возможно ли это в Tensorflow, и я обеспокоен тем, что мне, возможно, придется...

andrew / 29 декабря 2018

0 голосов

0 ответов

Как получить один выход из CNN, пока мы кормим его множественным количеством цветных изображений?

Я выполняю задание Deep-Q Learning, и у меня есть последовательность из 4 изображений, которые я...

Shahbaz Khan / 25 декабря 2018

0 голосов

1 ответ

Использование классификатора SVM и нескольких алгоритмов для повышения точности

Для проекта, над которым я работаю, я стремлюсь прогнозировать рыночные тренды и в результате...

User415 / 01 декабря 2018

0 голосов

0 ответов

Подача входной выборки по выборке (без последовательностей) в рекуррентной нейронной сети

В настоящее время я использую Keras (серверную часть Tensorflow) для написания агента обучения...

Hendrik / 20 ноября 2018

0 голосов

1 ответ

Вернуть распределение по набору действий из нейронной сети

Я пытаюсь построить нейронную сеть для вывода вероятностного распределения по множеству всего...

Siddhant Tandon / 19 ноября 2018

0 голосов

2 ответов

Разница между эволюционными стратегиями и усиленным обучением?

Я узнаю о подходе, применяемом в обучении армированию для робототехники, и натолкнулся на концепцию...

Vineet Pandey / 14 ноября 2018

0 голосов

1 ответ

Эпсилон и скорость обучения снижаются в эпсилон жадных q обучения

Я понимаю, что эпсилон отмечает компромисс между разведкой и эксплуатацией. Сначала вы хотите,...

maddie / 08 ноября 2018

0 голосов

0 ответов

Конвергенция Q-обучения и локальная проблема оптимумов

Я новичок в области обучения усилению (RL) и Q-обучения в частности. У меня есть набор из 20 штатов...

praneeth / 26 октября 2018

0 голосов

0 ответов

Отправить N агентов через ориентированный граф с минимальными затратами

У меня проблема с отправкой N агентов из исходной вершины 'src' в конечную вершину 'dst'...

mumuKabigon / 21 октября 2018

0 голосов

1 ответ

применение tf.gradients для функции

x = tf.Placeholder(shape=[1,31,5,1]) def func(x): operations... return output convolutionFunction =...

caissalover / 06 октября 2018

0 голосов

0 ответов

тензор потока копирует параметры в другую сеть (такая же архитектура), как DQN

Я внедряю сеть Deep Q (с фиксированной целью Q), для которой требуется назначить параметры из сети...

Yanpei / 11 сентября 2018

0 голосов

2 ответов

Глубокое подкрепление обучения - как бороться с границами в пространстве действий

Я создал пользовательское подкрепление обучения environment и agent, которое похоже на игру в...

Kevin Fang / 02 июля 2018

0 голосов

1 ответ

Вооруженный бандитами: почему мы увеличиваем награду на 1, когда случайная вероятность меньше вероятности успеха, назначенной бандиту

Я пытаюсь понять проблему многорукого бандита, используя python.Я продолжаю сталкиваться с частями...

Himansu Odedra / 06 июня 2018

0 голосов

3 ответов

В чем разница между подкрепляющим обучением, глубоким обучением и глубоким подкрепляющим обучением?

В чем разница между обучением с подкреплением, глубоким обучением и обучением с глубоким...

Miguel A. Friginal / 26 мая 2018

0 голосов

2 ответов

Почему и когда необходимо глубокое обучение с подкреплением вместо q-обучения?

Я изучал подкрепляющее обучение и понимаю концепции итерации «ценность / политика», TD (1) / TD (0)...

Davia DeNisco / 25 мая 2018

0 голосов

1 ответ

Как получается уравнение в «Стратегиях эволюции как масштабируемой альтернативе обучению усилению»?

В статье OpenAI "Стратегии развития как масштабируемая альтернатива обучению в области...

leonexu / 25 мая 2018

0 голосов

1 ответ

Алгоритм подкрепления, кажется, учится, но скрипт застревает, а агент не сбрасывается

В настоящее время работает над алгоритмом подкрепления с использованием Q-таблиц и графики черепах

Himansu Odedra / 21 мая 2018

0 голосов

1 ответ

Алгоритм обучения подкреплению, использующий графику черепах, не работает

В настоящее время пытаюсь реализовать алгоритм Q-таблицы в моей среде, созданной с использованием...

Himansu Odedra / 17 мая 2018

0 голосов

1 ответ

создание моей многоагентной среды путем глубокого обучения

Я должен создать свою собственную среду и применить алгоритм dqn в многоагентной среде. У меня 4...

Sa Na / 08 мая 2018

0 голосов

3 ответов

Зависимое от государства действие, установленное в обучении с подкреплением

Как люди справляются с проблемами, когда юридические действия в разных штатах различны?В моем...

Edmonds Karp / 25 апреля 2018

3 голосов

2 ответов

Какой алгоритм машинного обучения я должен использовать для Connect 4?

У меня есть ИИ, который хорошо играет в Connect 4 (используя минимакс).Теперь я хочу использовать...

Gunnarsi / 22 сентября 2011

3 голосов

1 ответ

XOR Hebbian test / пример нейронной сети

Я только что закончил писать некоторый код, который запускает нейронную сеть прямого обучения. Я...

A Person / 04 сентября 2011

22 голосов

6 ответов

Как я могу применить усиленное обучение к пространствам непрерывных действий?

Я пытаюсь заставить агента учить движения мыши, необходимые для наилучшего выполнения какой-либо...

zergylord / 17 августа 2011