[MDP]: Как рассчитать оптимальное значение для продолжающейся задачи? - PullRequest
0 голосов
/ 29 октября 2019

enter image description here

Привет, Мы узнали, как рассчитать V * для эпизодических задач, более конкретно, задачи с конечным состоянием со значением 0. Однако я действительно застрялв этом вопросе, поскольку нет терминального состояния, может ли кто-нибудь любезно объяснить это?

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...