Проблема на самом деле в миниконтесте по курсу CS188 (введение в AI), UC, Беркли на осень 2018. Вот ссылка на миниконтест 1.
(https://inst.eecs.berkeley.edu/~cs188/fa18/minicontest1.html/)
В этом мини-конкурсе мы должны применить алгоритмы поиска и задачи, реализованные в Проекте 1 (A *, ucs, bfs, dfs), для обработки более сложных сценариев, которые включают управление несколькими агентами pacman и планирование в условиях ограничения времени (и без привидений)) съесть все продукты в лабиринте до того, как счет упадет до 0. Есть также штрафы за принятое время принятия решения, и повышение очков за употребление пищевых гранул и еще больше за завершение всех гранул.
Я попробовал несколько способов решитьпроблема.
- Агенты, которые всегда идут к ближайшей точке, вычисленной bfs.
- Агенты, которые всегда поворачивают налево, когда есть шанс.
- Агенты, которые держатотслеживать местоположения, в которых они были за последние 7 шансов и не повторяться (используя очередь фиксированного размера) и случайным образом выбирать действие из правового актаионы возможны.Но эти агенты недостаточно эффективны, так как он (последний) дает победы только в 11 или 12 лабиринтах из 71 лабиринта со средним счетом около 262 на автогрейдере, предоставленном для конкурса.
Якаким-то образом не в состоянии заставить этих агентов Пакмана сотрудничать для быстрого извлечения всех пищевых гранул.
Мне нужны некоторые идеи о том, как выполнить это задание.