Производительность параллельной MCTS по сравнению с последовательной MCTS - PullRequest
0 голосов
/ 12 марта 2020

Я пытаюсь реализовать поиск по дереву Монте-Карло внутри шахматного ИИ, который я разрабатываю. Я пытаюсь подражать шахматному ИИ Альфа Ноль . В настоящее время мой поиск по дереву Монте-Карло выполняется последовательно на одноядерном процессоре, и он кажется очень медленным.

Согласно документу Alpha Zero, «Обучение проходило за 700 000 шагов (мини-пакетов размером 4096), начиная со случайно инициализированных параметров с использованием 5000 TPU первого поколения (15) для создания игр с самостоятельной игрой» и 64 TPU второго поколения для обучения нейронных сетей. "

Они используют MCTS для создания игр с самостоятельным воспроизведением.

Поскольку они используют TPU, они должны были использовать какое-то распараллеливание для генерации игр для самостоятельной игры? Я хочу сделать то же самое с моим графическим процессором. Я посмотрел на методы, такие как распараллеливание листьев, и они кажутся многообещающими. Может ли кто-нибудь дать мне несколько советов о том, как мне реализовать создание игр с самостоятельной игрой MCTS, поскольку эта часть является узким местом для моего алгоритма ?

...