Я относительно новичок в этой области, но не смог найти ничего похожего на эту проблему.
Проблема: агент может переходить из состояния s1 в состояние s2 разными способами (за один шаг) , Например, если состояния представляют местоположения, предположим, что агент может перейти от местоположения, представленного s1, к местоположению s2 за один шаг, выполнив одно из действий a1 или a2. Это означает, что несколько действий, предпринятых в каком-либо состоянии, приводят к одному и тому же состоянию.
Есть ли что-нибудь подобное в литературе?