Можно ли оценивать и обучать нейронную сеть, основанную на множестве результатов в группе, вместо того, чтобы оценивать один за другим? - PullRequest
1 голос
/ 24 мая 2019

Мне было интересно, возможно ли обучение нейронной сети группе выходов, которые она дает, вместо каждого отдельного выхода.

Например, насколько я знаю, если вы хотите построить нейронную сеть, в которую играют в крестики-нолики, вам придется тренировать ее так, чтобы она знала, какой ход является наилучшим, но без участия человека в том, что является лучшими состояниями Правления, как нейронная сеть могла бы «узнать», каков лучший ход?

Это заставило меня задуматься, есть ли способ обучать нейронную сеть на основе ее результатов, а не каждого выхода, скажем, нейронная сеть получает 1-й ход, я прошу у него выход, чтобы узнать его движение, а затем мой ход и так далее, я хочу знать, возможно ли обучить эту нейронную сеть на основе результатов игры, так как я не могу точно сказать, является ли ход "плохим" или "хорошим" до конца игры, и чтобы добраться до конца игры, мне нужно как минимум 3 выхода.

Возможно ли решить эту проблему с помощью нейронной сети или я ищу ответы в неправильной технологии?

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...