Я думаю, что это довольно распространенное сообщение для пользователей PyTorch с низким объемом памяти GPU:
RuntimeError: CUDA out of memory. Tried to allocate ? MiB (GPU ?; ? GiB total capacity; ? GiB already allocated; ? MiB free; ? cached)
Я хочу исследовать алгоритмы обнаружения объектов для моей курсовой работы. А для многих архитектур глубокого обучения требуется большой объем памяти GPU, поэтому моя машина не может обучать эти модели. Я попытался обработать изображение, загрузив каждый слой в графический процессор и затем загрузив его обратно:
for m in self.children():
m.cuda()
X = m(X)
m.cpu()
torch.cuda.empty_cache()
Но, похоже, это не очень эффективно. Мне интересно, есть ли какие-нибудь советы и рекомендации для обучения больших моделей глубокого обучения, используя мало памяти GPU. Заранее спасибо!
Редактировать: Я новичок в углубленном изучении. Прошу прощения, если это глупый вопрос :)