Question

Как мы помечаем каждый переход по важности, если при аппроксимации их значений Q мы используем пакеты состояний? Мы устанавливаем важность для каждой партии?

Не будь бараном · Answer 1 · 03 апреля 2020

решаемая. Я не знал, что нейронная сеть фактически выводит Q-значения для каждого состояния, помещает их в один массив и возвращает. Таким образом, в основном, у меня есть Q-значение каждого состояния, даже если я использую мини-пакеты состояний в качестве входных данных NN.

Проблема с приоритетным воспроизведением памяти для DQN

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Проблема с приоритетным воспроизведением памяти для DQN

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Похожие темы