Можно ли удалить самые старые опыты DQN? - PullRequest
0 голосов
/ 27 мая 2020

Я создал DQN с максимальным размером памяти 100000. У меня есть функция, которая удаляет самый старый элемент в памяти, если его размер больше максимального размера. Когда я запускал его на 200 эпизодов, я заметил, что память уже переполнена на 125-м эпизоде. Это нормально, что мой DQN удалит самый старый опыт из оставшихся эпизодов?

1 Ответ

0 голосов
/ 27 мая 2020

Да. Естественно, с помощью dqn можно удалить старые эпизоды из буфера. Однако агент может не тренироваться, если в этих предыдущих эпизодах произошли важные события, которые привели к награде. Каков размер вашего наблюдательного пространства, это изображение или что-то в этом роде? Вы должны уметь рассчитать размер общего буфера в гигабайтах. Если он подходит для вашего плунжера, я бы посоветовал увеличить размер буфера. Если вы увеличите его больше, чем емкость оперативной памяти, программа выдаст ошибку sh. Я также рекомендую использовать для вашего буфера коллекцию python deque. Он действует как массив максимального размера. Поэтому, когда вы добавляете к нему, когда он достигает своего предела, он автоматически удаляет первые элементы, поэтому буфер всегда имеет один и тот же размер.

...