Я думаю, вы делаете это слишком сложно.Если форма проблемы уже передана агенту (как набор действий по изменению состояния, которые будут формировать график), тогда ему необходимо знать, какова цель (i) иметь процедуру принятия решения для: «Я уже сделал?»- т.е. «это состояние, которое я только что запланировал или наблюдало за состоянием цели», и (ii) в качестве ориентира для эвристического поиска.Например, если вы использовали A *, вам нужен какой-то способ оценки расстояния до цели для заданного состояния поиска, поэтому по следствию вам необходимо знать, какое состояние цели является первым.