Я думаю, что в POMDP состояния все равно должны быть «полной правдой» (положение всех карт), а переходы - это просто правила игры (включая стратегию других игроков ?!).Наблюдения, конечно же, не должны зависеть от какой-либо истории, только от государства, иначе вы нарушаете предположение Маркова.Суть POMDP заключается в том, что агент может получать информацию о текущем состоянии, анализируя историю.Я не совсем уверен, если или как это относится к ООН, хотя.Если вы знаете, какие карты были разыграны и их порядок, можете ли вы получить информацию, используя историю?Возможно нет.Не уверен, но, возможно, не имеет смысла думать об этой игре как о POMDP, даже если вы используете решение, разработанное для POMDP.