Программа обучения укреплению со временем замирает - PullRequest
0 голосов
/ 31 марта 2020

В настоящее время я работаю над программой обучения Reinforcement, которая учит себя, как играть в игру змея. Проблема, с которой я сталкиваюсь, заключается в том, что, поскольку программа работает в фоновом режиме, она медленно поглощает все больше и больше памяти и, в конечном итоге, программа вылетает. Я удостоверился, чтобы проверить, есть ли какие-нибудь списки, которые медленно растут с течением времени. Насколько я знаю, таких списков нет, так как они становятся пустыми в начале каждой итерации. Я добавил обучающий код ниже (Изображения кода):

Кодовая часть 1

Кодовая часть 2

Код part3

Я впервые отправляю вопрос в stackoverflow. Извиняюсь, если я задал вопрос неправильно.

1 Ответ

0 голосов
/ 31 марта 2020

Вы уверены, что это проблема с памятью? Если это так, попробуйте установить переменные вне для l oop и очистить их для каждого l oop.

A=[]
B=[]
history=[]
for iteration in range(iterations):
   A=[]
   B=[]
   history=[]

Можете ли вы попробовать это и посмотреть, работает ли оно для вас.

...