Когда САРСА лучше, чем ожидаемая САРСА? - PullRequest
0 голосов
/ 08 октября 2018

Я прохожу курс обучения по усилению Cousera и застрял в этом вопросе с несколькими вариантами ответов.Я перепробовал более 40 разных ответов и не смог сделать это правильно.Очень ценю любые намеки на это.Спасибо!

Когда SARSA лучше, чем ожидаемая SARSA?

1, в тех случаях, когда пространство состояний слишком велико, поэтому мы не можем интегрировать аппроксимации в огромном пространстве состояний.

2, в случаях, когда невозможно вычислить явное ожидание по политике стохастичности.

3, в случаях, когда у нас много параметров W.

4, в случаях, когдау нас есть только несколько параметров W.

5, в случаях, когда гамма слишком велика.

6, в случаях, когда пространство действия слишком велико, поэтому мы не можем интегрироватьприближения на огромном пространстве действия.

...