Как уменьшить потребление памяти в PyTorch для редких обновлений градиентов? - PullRequest
0 голосов
/ 08 октября 2018

В моей модели около 500 * 200 * 200 параметров.В то время как для каждого образца обучения, только около 5 * 200 * 200 параметров связаны
Я хочу контролировать использование памяти, устанавливая размер пакета только для нескольких сэмплов, так что будет сложным каждый раз обновлять все 500 * 200 * 200 параметров.
Насколько я знаю, в Tensorflow нет подходящего решения для моей проблемы.Так есть ли какое-нибудь решение в PyTorch?

...