Я пытаюсь реализовать агент DDQN в MATLAB (для последующего использования в Simulink).
Сеть, которую я создал, работает должным образом, за исключением одного последнего вопроса: совокупности функции-значения-функции Q (s, a) = V (s) + A (s, a)
Сеть выглядит следующим образом:
Дуэли-Q-сеть
По желанию он производит два выхода. К сожалению, они просто объединяются, если я вычисляю результат теста с
output = sim(net, input);
Вместо структуры с двумя элементами (1x1 и 21x1), которые я мог бы объединить на втором шаге, я получаю массив 22x1.
Одна первоначальная идея состояла в том, чтобы добавить седьмой слой с линейной активацией и всеми весами, установленными на 1, что теоретически должно давать желаемый агрегированный результат. Но я сталкиваюсь с основной проблемой, как исправить веса ...
Я надеюсь, что вы, эксперты, можете дать мне последний совет, чтобы выяснить это.