stmemory и ltmemory в разделе «Как создать свой собственный AI AlphaZero с помощью Python и Keras» - PullRequest
0 голосов
/ 19 сентября 2018

Я следил Как создать свой собственный AI AlphaZero, используя Python и Keras

Git здесь В run.ipynb эта часть кода:

memory.clear_stmemory()

if len(memory.ltmemory) >= config.MEMORY_SIZE:

Пост мало что объяснил.Для чего используются memory.ltmemory и memory.stmemory?

1 Ответ

0 голосов
/ 19 сентября 2018

Если вы еще не поняли, ltmemory обозначает долговременную память, а stmemory обозначает кратковременную память.Я еще не долго смотрел на код GitHub, но у меня есть базовое понимание того, как AlphaZero и обучение подкреплению объединяются (я сам являюсь энтузиастом шахмат).

По сути, AlphaZero настолько силен, что он использует как долговременную, так и кратковременную память, так же, как мы, люди.Будучи способным принимать решения на основе локальных по времени данных (то есть событий, которые недавно произошли) и более глобальных данных (т. Е. Всей игры и ее результатов), AlphaZero может принимать решения, которые будут не толькопринесет пользу в краткосрочной перспективе, но принесет пользу и в долгосрочной.

Имеет ли это смысл или вообще отвечает на ваш вопрос?Я как-то быстро набрал это и дал довольно точное описание происходящего.Оставьте комментарий к вопросу, если есть одна часть, о которой вы хотите, чтобы я более подробно рассказал.

...