Вопросы с тегом армирование обучение - PullRequest

Вопросы с тегом армирование обучение

0 голосов
1 ответ

У меня есть вопрос о моем случае в теме обучения с подкреплением. Я хочу измерить принятие цены...

Jenifer Prochnow / 22 мая 2019
1 голос
0 ответов

Программа имеет ошибку сегментации при использовании последовательной модели keras, по крайней мере...

Cecilia Combemale / 16 мая 2019
1 голос
0 ответов

Я потратил несколько недель, пытаясь написать код Tensorflow уровня Python, который мог бы напрямую...

user3815403 / 15 мая 2019
0 голосов
0 ответов

Я пытаюсь создать простой обучающий агент для подкрепления, который получает награду из внешнего...

Rahul / 13 мая 2019
1 голос
0 ответов
0 голосов
1 ответ

У меня есть модель, состояние которой зависит от нескольких действий;Я могу принять один параметр в...

VIKAS POONIA / 11 мая 2019
2 голосов
0 ответов
2 голосов
1 ответ

У меня есть более или менее стандартная реализация DQN, решающая «прорыв» Atari (из курса обучения...

Boris Brodski / 07 мая 2019
1 голос
0 ответов

Могу ли я получить состояние рендеринга камеры с точки зрения глаз агента (в качестве визуальных...

Ziemo / 06 мая 2019
0 голосов
1 ответ

Я пытаюсь обучить Echo State Network для генерации текста со стохастической оптимизацией по линии...

Sami / 03 мая 2019
0 голосов
0 ответов

У меня проблемы с реализацией алгоритмов обучения с подкреплением (RL) в стиле тензорного потока в...

fredericgo / 02 мая 2019
1 голос
1 ответ

Я пытаюсь реализовать алгоритм ограниченного PPO для классической задачи управления, такой как...

Mika / 02 мая 2019
1 голос
0 ответов

Я знаю, что Dec-POMDP (Децентрализованный-POMDP) ​​является NEXP-завершенным для конечных временных...

Brij Rokad / 30 апреля 2019
0 голосов
0 ответов

Я пытаюсь построить автоэнкодер, приспособить его к данным наблюдений и использовать потерю в...

ZeroMaxinumXZ / 28 апреля 2019
0 голосов
0 ответов

ValueError: could not broadcast input array from shape (60,60,2) into shape (1) Я пытался каким-то...

Đức Anh Nguyễn Đỗ / 25 апреля 2019
1 голос
1 ответ

Я пытаюсь смоделировать карточную игру UNO как частично наблюдаемые марковские процессы принятия...

Brij Rokad / 25 апреля 2019
2 голосов
0 ответов

Читая газету Радуга из DeepMind, я застрял на следующем тексте в разделе «Экспериментальные...

Vlad-HC / 24 апреля 2019
1 голос
0 ответов

Я строю алгоритм обучения подкрепления актера-критика для решения окружения. Я хочу использовать...

BestR / 23 апреля 2019
0 голосов
0 ответов

Я успешно установил MuJoCo в моей системе. Задача состоит в том, чтобы заставить робота-гуманоида...

Tejveer / 23 апреля 2019
1 голос
1 ответ

Мне интересно, как на самом деле работает дисконтирование вознаграждений за обучение подкреплению.Я...

Perks / 21 апреля 2019
2 голосов
0 ответов

В чем разница между tf.keras.layers.Dense и tf.layers.Dense?Почему-то у меня DQN только сходимость...

J smit / 20 апреля 2019
0 голосов
1 ответ

Я реализовал q обучающий алгоритм, в котором агент пытается путешествовать как можно дальше.Я...

elemecro bots / 19 апреля 2019
1 голос
1 ответ

Для обучения я случайным образом генерирую сетку со значениями формы N, содержащими 0 и 1....

Sushrut Tadwalkar / 19 апреля 2019
0 голосов
0 ответов

В настоящее время я пытаюсь реализовать алгоритм SARSA, как описано в Саттоне, Барто, «Обучение...

GreenLogic / 18 апреля 2019
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...