Question

Поиск по методу Монте-Карло часто упоминается в исследованиях нейронной сети и обучения подкреплению.Что это такое и чем оно отличается от поиска в Монте-Карло.

Justin Shenk · Answer 1 · 04 июня 2019

Поиск по дереву Монте-Карло лучший первый, основанный на развертывании алгоритм поиска по дереву, который является современным для многих игр. Он работает путем расширения дерева поиска на основе случайной выборки пространства поиска.

Поиск луча расширяет только наиболее перспективный узел в ограниченном наборе. Он широко используется в задачах, основанных на последовательности, таких как НЛП и генерация музыки. Одно из главных преимуществ поиска луча состоит в том, что он поддерживает управляемость для больших систем, где число возможных результатов может превышать пределы памяти.

Поиск по методу Монте-Карло , введенный в 2012 году двумя документами Cazenave и Байер и др. , расширяет поиск по Nested Monte Carlo, где игры играли, выбирая каждый ход, основываясь на результатах нижнего уровня поиска Монте-Карло. Самый низкий уровень - это игра в плей-офф (игра, в которой ходы выполняются случайным образом).

Цитирование статьи:

Размер балки фиксирован для каждого уровня. Только лучшие игры сохраняются на заданном уровне.

Например, размер поиска луча 2 означает, что при каждом перемещении сохраняются две лучшие позиции среди всех детей. Это намного эффективнее, чем хранение всех детей.

Что такое поиск по методу Монте-Карло в нейронных сетях?

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Что такое поиск по методу Монте-Карло в нейронных сетях?

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Похожие темы