Вопросы с тегом армирование обучение - PullRequest

Вопросы с тегом армирование обучение

0 голосов
1 ответ

Я пытаюсь понять код пони Карпати в Python, объясненный здесь: Пон Карпати # forward the policy...

mLstudent33 / 19 февраля 2019
0 голосов
2 ответов

Я проходил этот учебник и увидел следующий фрагмент кода: # Calculate score to determine when the...

Pinocchio / 18 февраля 2019
0 голосов
1 ответ

Я получаю следующую ошибку в терминале: Traceback (most recent call last): File...

thunde47 / 17 февраля 2019
0 голосов
0 ответов

Я пытаюсь реализовать собственную реализацию алгоритма Advantage Actor Critic, используя тензор...

White blue rabbit / 16 февраля 2019
0 голосов
0 ответов

Я пытаюсь реализовать бумагу DeepMimic, но застрял на настройке.Как изменить последнюю часть...

Littleredridinghood / 15 февраля 2019
0 голосов
0 ответов

базовый вопрос скорее относится к математике и реализации, поэтому приведенная ниже часть обучения...

Hendrik / 14 февраля 2019
0 голосов
0 ответов

Я использую многопроцессорный модуль pytorch для генерации опыта и сохранения его в объекте manager

Han Zheng / 13 февраля 2019
0 голосов
0 ответов

Я планирую обучить агента Mario играть самостоятельно, используя DQN.Но я также хочу иметь...

omnidevio / 12 февраля 2019
0 голосов
0 ответов

Я создал простую нейронную сеть с pytorch, предназначенную для расчета движений юнитов внутри сетки

Appleshell / 09 февраля 2019
0 голосов
1 ответ

У меня есть несколько вопросов об обучении нейронной сети с использованием обучения с подкреплением...

Meysam Ghorbani / 06 февраля 2019
0 голосов
1 ответ

Я внедряю PPO с GAE в качестве преимуществ.В следующем коде я вычисляю GAE и возвращаю его в...

Sherwin Chen / 05 февраля 2019
0 голосов
0 ответов

Я потратил недели на то, чтобы заставить модель обучения подкрепления актера-критика работать в...

Sam Peterson / 05 февраля 2019
0 голосов
1 ответ

Мой вопрос следует за моим исследованием кода в учебнике по PyTorch DQN, но затем относится к...

Dark_Voyager / 04 февраля 2019
0 голосов
0 ответов

Я использую тренажерный зал Open AI и марио-код Кристиана Каутена, чтобы научить его играть самому

omnidevio / 04 февраля 2019
0 голосов
0 ответов

Я разработал небольшое упражнение для обучения.Проблема в том, что после возобновления тренировки...

user898160 / 31 января 2019
0 голосов
0 ответов

Я пытаюсь настроить проект обучения с подкреплением, используя Gym & kears_rl. Описание: Учитывая...

Yaniv Sheffer / 30 января 2019
0 голосов
1 ответ

В играх atari по умолчанию используется «периодическая политика» в A2C?Я обнаружил, что трудно...

Yunqiu Xu / 29 января 2019
0 голосов
1 ответ

Я изучал tenorflow и rl в течение нескольких месяцев, и в течение последних нескольких дней я...

Sam Peterson / 27 января 2019
0 голосов
0 ответов

Я нахожусь в процессе реализации модели DQN с нуля в PyTorch с целевой средой Atari Pong.После...

Mink / 25 января 2019
0 голосов
1 ответ

Учитывая, что среда OpenAI Gym MountainCar-v0 ВСЕГДА возвращает -1.0 в качестве награды (даже когда...

keith gould / 25 января 2019
0 голосов
0 ответов

Я реализую и основываюсь на воспроизведении опыта на жестких дисках (Reinforcement Learning) в...

Kenzo / 22 января 2019
0 голосов
0 ответов

Я перебираю эту статью: Оптимизация размещения устройства с обучением усилению , и я проверяю...

Andrew Nguyen Ashew / 19 января 2019
0 голосов
0 ответов

Я пытаюсь реализовать A2C с Lasagne + Theano (Python), чтобы решить стандартные проблемы с...

Miguel A. Friginal / 18 января 2019
0 голосов
1 ответ

Я пытаюсь реализовать градиент политики для проблемы контекстного бандита (https://medium

Alex Van de Kleut / 16 января 2019
0 голосов
0 ответов

Таким образом, последний поток, который я написал о Reinforcement Learning, был отмечен как слишком...

Sergio / 16 января 2019
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...