Для проекта класса ai мне нужно реализовать алгоритм обучения с подкреплением, который превосходит простую игру в тетрис. Игра написана на Java и у нас есть исходный код. Я знаю основы теории обучения с подкреплением, но мне было интересно, имел ли кто-либо из сообщества SO опыт в работе с подобными вещами.
- Какими будут ваши рекомендуемые показания для реализации усиленного обучения в игре тетрис?
- Существуют ли какие-нибудь хорошие проекты с открытым исходным кодом, которые выполняют подобные вещи, которые стоит проверить?
Изменить: Чем конкретнее, тем лучше, но общие ресурсы по этому вопросу приветствуются.
Продолжение:
Подумал, что было бы неплохо, если бы я опубликовал продолжение.
Вот решение (код и рецензия), которое я выбрал для будущих студентов:).
Бумага / Код