Для одноразовой версии игры лучшая стратегия всегда заключается в дефекте, поскольку нет никаких шансов на ответный удар.
Это становится более интересным для повторной версии, так как игроки могут отвечать на предыдущие выборы своих оппонентов.
Если мы заранее точно знаем, сколько будет раундов, то логическая «лучшая» стратегия по-прежнему всегда будет дефектной. Это связано с тем, что на последнем ходу всегда имеет смысл выходить из строя, поскольку нет никаких шансов на ответный удар. Конечно, наш рациональный оппонент будет знать это, а также всегда будет дефект на последнем ходу. Это дает нам разумную возможность выйти на предпоследний ход, поскольку в любом случае нет шансов на сотрудничество на последнем ходу. Следуя этой логике до ее естественного завершения, мы должны идти на каждом шагу.
Когда общее количество раундов неизвестно, все становится интереснее. Хорошая стратегия для игры должна попытаться предсказать, что сделает противник. Я исследовал, используя эволюционные алгоритмы и простое машинное обучение с моделированием оппонента, чтобы генерировать стратегии для игры для моей степени магистра. Если вы действительно заинтересованы, вы можете прочитать мой тезис .
В соответствии с рекомендациями Ювала, вероятно, лучшее место для начала - основополагающая книга Аксельрода . Если вы действительно, действительно заинтересованы в этом материале, было продолжение 20-й годовщины , которое включало в себя большую часть более поздней работы над IPD (Дилемма повторного заключенного) другие исследователи.
Кроме того, я бы настоятельно рекомендовал Дилемма узника Уильяма Паундстоуна, которая является частью биографии Джона фон Неймана и частью введения в теорию игр.