Вопросы с тегом д-обучение

1 голос

1 ответ

Свободное от модели или основанное на модели глубокое усиление обучения для автомобильных гонок?

Я новичок в области обучения подкреплению.Так что я совершенно запутался с терминами «на основе...

antoine Mathu / 28 мая 2019

0 голосов

0 ответов

украсить изображение с подкреплением обучения

Я пытаюсь сформулировать и решить следующую проблему мутации изображения.Предположим, я пытаюсь...

lllllllllllll / 27 мая 2019

1 голос

2 ответов

tf.losses.mean_squared_error с отрицательной целью

Я использую Q learning и хочу знать, могу ли я использовать функцию расчета потерь tf.losses

Xeyes / 23 мая 2019

0 голосов

1 ответ

Укрепление обучения без окончательного состояния?

У меня есть вопрос о моем случае в теме обучения с подкреплением. Я хочу измерить принятие цены...

Jenifer Prochnow / 22 мая 2019

1 голос

1 ответ

Как научить правила игры для ай?

Я делаю AI как альфа GO, используя DQN.НО у меня проблемы с обучением правилам игры.ИИ не знает...

장영연 / 16 мая 2019

0 голосов

1 ответ

Как я могу выполнять действия и состояния, когда мой переход между состояниями зависит от нескольких действий одновременно?

У меня есть модель, состояние которой зависит от нескольких действий;Я могу принять один параметр в...

VIKAS POONIA / 11 мая 2019

1 голос

1 ответ

DQN - Как передать вход 4-х кадров из игры в виде одного состояния

Я читал этот блог о Deep Q-Learning . 1- В разделе блога The input я хотел узнать, как мы подаем 4...

Hazzaldo / 01 мая 2019

1 голос

1 ответ

Как выбрать действие с наибольшим значением Q

Я реализовал DQN с опытом воспроизведения. Вход 50x50x1.При размере пакета 4 ввод будет равен (4,50...

elemecro bots / 22 апреля 2019

2 голосов

1 ответ

как назначить состояния в DQN (Deep Q-Network)?

Я выполняю симуляцию полета с автопилотом, поэтому мне нужно создать DQN (Deep Q-Network) для...

yousif fayed / 22 апреля 2019

0 голосов

0 ответов

Почему нейронная сеть перестает учиться?

Я пишу нейронную сеть, которая научилась играть в игру "connect4" Репозиторий Я использую CNN и...

Aminev Timur / 21 апреля 2019

0 голосов

0 ответов

Почему вознаграждение колеблется за Double Q-Learning?

Я пытаюсь реализовать Double Q-Learning с использованием нейронных сетей из библиотеки Keras.Когда...

Gauranga Das / 20 апреля 2019

0 голосов

1 ответ

Необходимо ли заканчивать эпизоды, когда в обучении подкреплению происходит столкновение

Я реализовал q обучающий алгоритм, в котором агент пытается путешествовать как можно дальше.Я...

elemecro bots / 19 апреля 2019

1 голос

1 ответ

Сеть хорошо тренируется на сетке формы N, но при оценке любого изменения не получается

Для обучения я случайным образом генерирую сетку со значениями формы N, содержащими 0 и 1....

Sushrut Tadwalkar / 19 апреля 2019

0 голосов

0 ответов

Странное поведение функции обновления в Q Learning

Возникла проблема при обновлении значений q.Они стремятся к бесконечности.Приведенный ниже код...

Pete / 18 апреля 2019

0 голосов

0 ответов

SARSA с линейным значением Func.Прибл.не сходится к правильным Q-факторам

Я пытался внедрить SARSA с LVFA. До сих пор я реализовал следующий код, но он, похоже, не работает...

Uzair Akbar / 17 апреля 2019

1 голос

1 ответ

Проблемы с реализацией приблизительного (функционально-ориентированного) обучения

Я новичок в изучении подкрепления. Недавно я узнал о приближенном q-обучении или q-основанном на...

Love2Code / 06 апреля 2019

0 голосов

0 ответов

Может ли DQNAgent с переопределением PrioritizedMemory?

Я использую DQNAgent и PrioritizedMemory, чтобы тренироваться против среды, и за вознаграждение это...

Angelo / 28 марта 2019

2 голосов

0 ответов

Это правда ?как насчет ожидаемого SARSA и двойного Q-Learning?

Я учусь Reinforcement Learning, и я сталкиваюсь с проблемой понимания разницы между SARSA,...

Cooper / 27 марта 2019

0 голосов

1 ответ

Показать потери в DQN Tensorflow, не выходя из tf.Session ()

У меня полностью настроен и работает DQN, но я не могу понять, как отобразить потери, не выходя из...

Rayna Levy / 25 марта 2019

2 голосов

0 ответов

Python Tensorflow DQN Следующие шаги

Я не могу понять следующие шаги для моей Deep Q Network. Я пытаюсь оптимизировать автобусные...

Rayna Levy / 23 марта 2019

0 голосов

0 ответов

Java 2D хеш-таблицы для обучения Q

В настоящее время я пытаюсь провести Q обучение для Игры и хотел бы создать таблицу Q обучения.По...

ILikeCode / 21 марта 2019

0 голосов

0 ответов

Добавить функцию агрегирования для Dueling DQN в пользовательскую нейронную сеть в MATLAB

Я пытаюсь реализовать агент DDQN в MATLAB (для последующего использования в Simulink). Сеть,...

Viktor Katzy / 06 марта 2019

0 голосов

0 ответов

Глубокое Q-обучение, LSTM и конвергенция Q-значений

Я внедряю агента по усиленному обучению, который предпринимает действия с учетом временных цен

FS93 / 05 марта 2019

0 голосов

0 ответов

Как использовать матрицы в таблицах Q

Я построил таблицу Q, которая является hasmap-картой hashmaps.Вот так: observation1: action1:...

Felix Rosén / 20 февраля 2019

0 голосов

1 ответ

обучение с подкреплением - движение к путевой точке

Я играю с созданием самостоятельной машины в компьютерную игру.Я думал об использовании обучения с...

DaveS / 12 февраля 2019