Поиск по дереву Монте-Карло лучший первый, основанный на развертывании алгоритм поиска по дереву, который является современным для многих игр. Он работает путем расширения дерева поиска на основе случайной выборки пространства поиска.
Поиск луча расширяет только наиболее перспективный узел в ограниченном наборе. Он широко используется в задачах, основанных на последовательности, таких как НЛП и генерация музыки. Одно из главных преимуществ поиска луча состоит в том, что он поддерживает управляемость для больших систем, где число возможных результатов может превышать пределы памяти.
Поиск по методу Монте-Карло , введенный в 2012 году двумя документами Cazenave и Байер и др. , расширяет поиск по Nested Monte Carlo, где игры играли, выбирая каждый ход, основываясь на результатах нижнего уровня поиска Монте-Карло. Самый низкий уровень - это игра в плей-офф (игра, в которой ходы выполняются случайным образом).
Цитирование статьи:
Размер
балки фиксирован для каждого уровня. Только
лучшие игры сохраняются на заданном уровне.
Например, размер поиска луча 2 означает, что при каждом перемещении сохраняются две лучшие позиции среди всех детей. Это намного эффективнее, чем хранение всех детей.