Я прохожу курс обучения по усилению Cousera и застрял в этом вопросе с несколькими вариантами ответов.Я перепробовал более 40 разных ответов и не смог сделать это правильно.Очень ценю любые намеки на это.Спасибо!
Когда SARSA лучше, чем ожидаемая SARSA?
1, в тех случаях, когда пространство состояний слишком велико, поэтому мы не можем интегрировать аппроксимации в огромном пространстве состояний.
2, в случаях, когда невозможно вычислить явное ожидание по политике стохастичности.
3, в случаях, когда у нас много параметров W.
4, в случаях, когдау нас есть только несколько параметров W.
5, в случаях, когда гамма слишком велика.
6, в случаях, когда пространство действия слишком велико, поэтому мы не можем интегрироватьприближения на огромном пространстве действия.