Добавить функцию агрегирования для Dueling DQN в пользовательскую нейронную сеть в MATLAB - PullRequest
0 голосов
/ 06 марта 2019

Я пытаюсь реализовать агент DDQN в MATLAB (для последующего использования в Simulink).

Сеть, которую я создал, работает должным образом, за исключением одного последнего вопроса: совокупности функции-значения-функции Q (s, a) = V (s) + A (s, a)

Сеть выглядит следующим образом: Дуэли-Q-сеть

По желанию он производит два выхода. К сожалению, они просто объединяются, если я вычисляю результат теста с

output = sim(net, input);

Вместо структуры с двумя элементами (1x1 и 21x1), которые я мог бы объединить на втором шаге, я получаю массив 22x1.

Одна первоначальная идея состояла в том, чтобы добавить седьмой слой с линейной активацией и всеми весами, установленными на 1, что теоретически должно давать желаемый агрегированный результат. Но я сталкиваюсь с основной проблемой, как исправить веса ...

Я надеюсь, что вы, эксперты, можете дать мне последний совет, чтобы выяснить это.

...