Вопросы с тегом усиление обучение - PullRequest

Вопросы с тегом усиление обучение

0 голосов
0 ответов

В дуэльной архитектуре авторы описывают эту архитектуру следующим образом: поток кодировщика поток...

PySeeker / 28 сентября 2019
0 голосов
0 ответов

Я пытаюсь тренировать нейронную сеть, играя в yahtzee.На каждом ходу сеть должна выбирать категории...

feedFloward / 06 июля 2019
2 голосов
0 ответов

Я рассматриваю статью Оптимизация политики с исследованиями на основе моделей , раздел 2 о выводе V...

Per Arne Andersen / 22 июня 2019
0 голосов
0 ответов

Я пробую обучать модели глубокого подкрепления обучению задачу выхода из лабиринта, и каждый раз,...

lllllllllllll / 28 мая 2019
0 голосов
0 ответов

Я пытаюсь сформулировать и решить следующую проблему мутации изображения.Предположим, я пытаюсь...

lllllllllllll / 27 мая 2019
1 голос
2 ответов

Я использую Q learning и хочу знать, могу ли я использовать функцию расчета потерь tf.losses

Xeyes / 23 мая 2019
3 голосов
1 ответ

Я использую нейронную сеть и тензорный поток для усиления обучения по различным предметам с помощью...

Xeyes / 16 мая 2019
1 голос
1 ответ

Я делаю AI как альфа GO, используя DQN.НО у меня проблемы с обучением правилам игры.ИИ не знает...

장영연 / 16 мая 2019
1 голос
1 ответ

Мой друг и я тренируем DDQN для изучения 2D футбола.Я тренировал модель около 40 000 эпизодов, но...

Huseyincan Erbayraktar / 15 мая 2019
1 голос
1 ответ

Я читал этот блог о Deep Q-Learning . 1- В разделе блога The input я хотел узнать, как мы подаем 4...

Hazzaldo / 01 мая 2019
0 голосов
0 ответов

Я пытаюсь реализовать Double Q-Learning с использованием нейронных сетей из библиотеки Keras.Когда...

Gauranga Das / 20 апреля 2019
1 голос
1 ответ

Я новичок в изучении подкрепления. Недавно я узнал о приближенном q-обучении или q-основанном на...

Love2Code / 06 апреля 2019
0 голосов
0 ответов

Я смоделировал игру на питоне.Когда игра вызывается, она выполняет полный цикл со случайным игроком...

Rhys / 01 апреля 2019
0 голосов
1 ответ

Мне нужно суммировать градиенты в каждой итерации, а затем передавать эти градиенты другому...

Han Zheng / 17 марта 2019
2 голосов
0 ответов
0 голосов
1 ответ

Я работаю над своей дипломной работой бакалавра. Моя тема - обучение с подкреплением.Настройка:...

Dennis Ziganow / 02 марта 2019
0 голосов
1 ответ

Я хочу реализовать следующий алгоритм, взятый из этой книги, раздел 13.6 : Я непонять, как...

Gulzar / 17 февраля 2019
0 голосов
1 ответ

Мой партнер по проекту и я в настоящее время сталкиваемся с проблемой в нашем последнем...

jan / 14 февраля 2019
0 голосов
1 ответ

При попытке создать нейронную сеть и оптимизировать ее с помощью Pytorch я получаю ValueError:...

Gulzar / 13 февраля 2019
0 голосов
0 ответов

Я пытаюсь создать нейронную сеть, чтобы играть в эмулированную игру atari "BreakoutDeterministic"

niallmandal / 12 февраля 2019
0 голосов
1 ответ

Выше приведены средние оценки каждые 100 эпизодов, когда агент работает в среде gym...

Sherwin Chen / 10 февраля 2019
0 голосов
1 ответ

Я пытаюсь изменить код кераса для нейронной сети на код тензорного потока.Я выбрал несколько...

jongchul / 30 января 2019
0 голосов
1 ответ

Я относительно новичок в понятиях машинного обучения, и я читал несколько лекций / учебных пособий...

Adam Whitehurst / 23 января 2019
0 голосов
1 ответ

Я тренирую агента с DQN. Награда увеличивается, а убыток уменьшается. Это хороший знак, у меня...

fgauth / 14 января 2019
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...