Вопросы с тегом д-обучение - PullRequest

Вопросы с тегом д-обучение

1 голос
1 ответ

Я новичок в области обучения подкреплению.Так что я совершенно запутался с терминами «на основе...

antoine Mathu / 28 мая 2019
0 голосов
0 ответов

Я пытаюсь сформулировать и решить следующую проблему мутации изображения.Предположим, я пытаюсь...

lllllllllllll / 27 мая 2019
1 голос
2 ответов

Я использую Q learning и хочу знать, могу ли я использовать функцию расчета потерь tf.losses

Xeyes / 23 мая 2019
0 голосов
1 ответ

У меня есть вопрос о моем случае в теме обучения с подкреплением. Я хочу измерить принятие цены...

Jenifer Prochnow / 22 мая 2019
1 голос
1 ответ

Я делаю AI как альфа GO, используя DQN.НО у меня проблемы с обучением правилам игры.ИИ не знает...

장영연 / 16 мая 2019
0 голосов
1 ответ

У меня есть модель, состояние которой зависит от нескольких действий;Я могу принять один параметр в...

VIKAS POONIA / 11 мая 2019
1 голос
1 ответ

Я читал этот блог о Deep Q-Learning . 1- В разделе блога The input я хотел узнать, как мы подаем 4...

Hazzaldo / 01 мая 2019
1 голос
1 ответ

Я реализовал DQN с опытом воспроизведения. Вход 50x50x1.При размере пакета 4 ввод будет равен (4,50...

elemecro bots / 22 апреля 2019
2 голосов
1 ответ

Я выполняю симуляцию полета с автопилотом, поэтому мне нужно создать DQN (Deep Q-Network) для...

yousif fayed / 22 апреля 2019
0 голосов
0 ответов

Я пишу нейронную сеть, которая научилась играть в игру "connect4" Репозиторий Я использую CNN и...

Aminev Timur / 21 апреля 2019
0 голосов
0 ответов

Я пытаюсь реализовать Double Q-Learning с использованием нейронных сетей из библиотеки Keras.Когда...

Gauranga Das / 20 апреля 2019
0 голосов
1 ответ

Я реализовал q обучающий алгоритм, в котором агент пытается путешествовать как можно дальше.Я...

elemecro bots / 19 апреля 2019
1 голос
1 ответ

Для обучения я случайным образом генерирую сетку со значениями формы N, содержащими 0 и 1....

Sushrut Tadwalkar / 19 апреля 2019
0 голосов
0 ответов

Возникла проблема при обновлении значений q.Они стремятся к бесконечности.Приведенный ниже код...

Pete / 18 апреля 2019
0 голосов
0 ответов

Я пытался внедрить SARSA с LVFA. До сих пор я реализовал следующий код, но он, похоже, не работает...

Uzair Akbar / 17 апреля 2019
1 голос
1 ответ

Я новичок в изучении подкрепления. Недавно я узнал о приближенном q-обучении или q-основанном на...

Love2Code / 06 апреля 2019
0 голосов
0 ответов

Я использую DQNAgent и PrioritizedMemory, чтобы тренироваться против среды, и за вознаграждение это...

Angelo / 28 марта 2019
2 голосов
0 ответов

Я учусь Reinforcement Learning, и я сталкиваюсь с проблемой понимания разницы между SARSA,...

Cooper / 27 марта 2019
0 голосов
1 ответ

У меня полностью настроен и работает DQN, но я не могу понять, как отобразить потери, не выходя из...

Rayna Levy / 25 марта 2019
2 голосов
0 ответов

Я не могу понять следующие шаги для моей Deep Q Network. Я пытаюсь оптимизировать автобусные...

Rayna Levy / 23 марта 2019
0 голосов
0 ответов

В настоящее время я пытаюсь провести Q обучение для Игры и хотел бы создать таблицу Q обучения.По...

ILikeCode / 21 марта 2019
0 голосов
0 ответов

Я пытаюсь реализовать агент DDQN в MATLAB (для последующего использования в Simulink). Сеть,...

Viktor Katzy / 06 марта 2019
0 голосов
0 ответов

Я внедряю агента по усиленному обучению, который предпринимает действия с учетом временных цен

FS93 / 05 марта 2019
0 голосов
0 ответов

Я построил таблицу Q, которая является hasmap-картой hashmaps.Вот так: observation1: action1:...

Felix Rosén / 20 февраля 2019
0 голосов
1 ответ

Я играю с созданием самостоятельной машины в компьютерную игру.Я думал об использовании обучения с...

DaveS / 12 февраля 2019
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...