Как моделировать этот вид искусственного интеллекта? - PullRequest
7 голосов
/ 17 июля 2010

играя в эту игру, я удивлялся, как ИИ, контролирующий либо детективов, либо преступника, может работать.

Для ленивых цель игры проста:

  • настольная игра - это неориентированные графы, которые имеют 4 вида ребер (которые также могут перекрываться для одной и той же пары или вершин), каждый вид - это вид транспорта, для которого требуется особый вид билета
  • у детективов есть куча билетов для перемещения по этому графику, один ход за ход (что означает переход от узла к другому узлу).Преступник может делать тот же набор ходов (плюс 3 эксклюзивных пути), но без ограничений по тикам
  • преступник обычно скрыт для детективов, но он должен проявить себя в 5 определенных ходах (а затем спрятаться снова)
  • если детективы могут его поймать (один из них должен занимать одну и ту же ячейку преступника) до 24 ходов, то они выигрывают, в противном случае преступник выигрывает
  • , преступник должен показать, какойбилет, который он использует каждый ход, но у него также есть 1 черный билет на каждого детектива (предположим, 5), который может быть использован для исчезновения этой вещи
  • у преступника также есть два билета 2x, которые позволяют ему использовать два билета (и такдва движения) в один и тот же ход

Я могу эффективно подумать об искусственном интеллекте для преступника, что это будет просто дерево минимальных значений, которое пытается выбрать движения, которые максимизируют количество ходов, необходимых детективам для достиженияего (это кажется хорошим показателем), но я не могу думать ничего достаточно крутого для детективов, которые должны сотрудничать и тПопробуй угадать, где может быть преступник, посмотрев на билеты, которые он использует.

Это просто для удовольствия, но есть ли у тебя какие-нибудь классные идеи для разработки чего-то более умного?

Ответы [ 4 ]

1 голос
/ 19 июля 2010

Вы спросили, как смоделировать это, а не как решить это эффективно:

Это может быть легко смоделировано как частично наблюдаемый процесс принятия решения Маркова ( вики-ссылка ). Это работает как для детективов, так и для преступников. POMDP - очень общая модель.

1 голос
/ 17 июля 2010

Мне нравится эта игра, и я думаю, что для детективов вы хотите смоделировать вероятность того, что преступник находится в каждом месте.Время от времени вы знаете точное положение преступника, и затем вы можете принять во внимание следующие шаги, которые он делает, чтобы определить, в каких точках он может оказаться.

Как только вы это сделаете, я не совсем уверен, как оптимизировать ходы детективов.Вы можете перемещать детективов, чтобы уменьшить набор возможностей, эффективно загоняя преступника в ловушку.Но я уверен, что есть еще какая-то стратегия более высокого уровня, связанная с билетами и не исчерпывающая их.

0 голосов
/ 22 июля 2010

Чтобы командная работа проходила между детективами, вам нужно смоделировать их как команду, а не как личность. Минимакс по-прежнему хороший путь, но (к сожалению) ваш фактор ветвления будет стремительно расти.

Вместо того, чтобы обходить все детективы, делающие то, что кажется лучшим для каждого, вместо этого для вашей команды детективов вы отрабатываете каждую перестановку ходов, которые они могли сделать. Если командная работа помогает в этой игре, то минимакс будет благоприятствовать перестановкам, в которых детективы работают вместе.

Я не уверен, будет ли это практично, 5 детективов на 24 слоя могут быть слишком большой работой, но было бы интересно попробовать, и в этом суть, верно?

0 голосов
/ 17 июля 2010

Я полагаю, что какая-то реализация в Монте-Карло была бы отличным кандидатом для этого, т.е. имитируя тысячи комбинаций и выбирая ту, которая в большинстве случаев заканчивается лучшим результатом. Поскольку преступник должен быть виден в течение 5 ходов, фактор ветвления должен оставаться под надежным контролем, хотя было также показано, что MC является очень хорошей техникой в ​​играх с высоким коэффициентом ветвления, т.е. Go.

...