Я пытаюсь создать простой планировщик на основе STRIPS .Я завершил базовую функциональность для вычисления отдельных вероятностных планов, которые будут достигать цели, но теперь я пытаюсь определить, как агрегировать эти планы на основе их первоначального действия, чтобы определить, какое «общее» лучшее действие происходит в момент времени t0..
Рассмотрим следующий пример.Полезность, ограниченная от 0 до 1, показывает, насколько хорошо план выполняет цель.CF, также ограниченный между 0 и 1, представляет фактор уверенности, или вероятность того, что выполнение плана приведет к данной полезности.
Plan1: CF=0.01, Utility=0.7
Plan2: CF=0.002, Utility=0.9
Plan3: CF=0.03, Utility=0.03
Если все три плана, которые являются взаимоисключающими, начинаются сдействие A1, как я должен объединить их, чтобы определить общую «пригодность» для использования действия A1?Моя первая мысль - суммировать факторы достоверности и умножить их на среднее значение коммунальных услуг.Кажется ли это правильным?
Таким образом, мой текущий результат будет выглядеть так:
fitness(A1) = (0.01 + 0.002 + 0.03) * (0.7 + 0.9 + 0.03)/3. = 0.02282
Или я должен рассчитать индивидуальные вероятные утилиты и усреднить их?
fitness(A1) = (0.01*0.7 + 0.002*0.9 + 0.03*0.03)/3. = 0.00323
Есть ли более теоретически обоснованный способ?