Что такое поиск по методу Монте-Карло в нейронных сетях? - PullRequest
0 голосов
/ 04 июня 2019

Поиск по методу Монте-Карло часто упоминается в исследованиях нейронной сети и обучения подкреплению.Что это такое и чем оно отличается от поиска в Монте-Карло.

1 Ответ

0 голосов
/ 04 июня 2019

Поиск по дереву Монте-Карло лучший первый, основанный на развертывании алгоритм поиска по дереву, который является современным для многих игр. Он работает путем расширения дерева поиска на основе случайной выборки пространства поиска.

Поиск луча расширяет только наиболее перспективный узел в ограниченном наборе. Он широко используется в задачах, основанных на последовательности, таких как НЛП и генерация музыки. Одно из главных преимуществ поиска луча состоит в том, что он поддерживает управляемость для больших систем, где число возможных результатов может превышать пределы памяти.

Поиск по методу Монте-Карло , введенный в 2012 году двумя документами Cazenave и Байер и др. , расширяет поиск по Nested Monte Carlo, где игры играли, выбирая каждый ход, основываясь на результатах нижнего уровня поиска Монте-Карло. Самый низкий уровень - это игра в плей-офф (игра, в которой ходы выполняются случайным образом).

Цитирование статьи:

Размер s_level балки фиксирован для каждого уровня. Только s_level лучшие игры сохраняются на заданном уровне.

Например, размер поиска луча 2 означает, что при каждом перемещении сохраняются две лучшие позиции среди всех детей. Это намного эффективнее, чем хранение всех детей.

...