МОДЕЛЬ ChainerCV SSD512 не тренировочная - PullRequest
0 голосов
/ 18 марта 2019

Я использовал SSD300 (предварительно обученную модель imagenet) для обнаружения и распознавания для двухклассовой классификации: [Basketball-ChainerCV] (https://github.com/atom2k17/Basketball-ChainerCV/blob/master/basketballproject.py). Обучение и прогнозы хороши. Но когда я использую SSD512 (imagenetпредварительно обученную модель) во время обучения я получаю следующую ошибку:

/usr/local/lib/python3.6/dist- 
packages/chainer/functions/connection/convolution_2d.py in 
_forward_cudnn(self, x, W, b, y)
226         cuda.cudnn.convolution_forward(
227             x, W, b, y, pad, stride, dilation, self.groups,
228             auto_tune=auto_tune, tensor_core=tensor_core)
229         return y,
230 
cupy/cudnn.pyx in cupy.cudnn.convolution_forward()
cupy/cudnn.pyx in cupy.cudnn._find_algorithm_fwd()
cupy/cuda/memory.pyx in cupy.cuda.memory.alloc()
cupy/cuda/memory.pyx in cupy.cuda.memory.MemoryPool.malloc()
cupy/cuda/memory.pyx in cupy.cuda.memory.MemoryPool.malloc()
cupy/cuda/memory.pyx in cupy.cuda.memory.SingleDeviceMemoryPool.malloc()
cupy/cuda/memory.pyx in cupy.cuda.memory.SingleDeviceMemoryPool._malloc()
cupy/cuda/memory.pyx in cupy.cuda.memory._try_malloc()
OutOfMemoryError: out of memory to allocate 1073741824 bytes (total 
12092240384 bytes)

Я использую среду графического процессора Google Colab. Любые указания по решению этой проблемы приветствуются.

1 Ответ

0 голосов
/ 20 марта 2019

Как указывалось в комментариях @corochann, эта проблема с памятью решается, когда trainer.run () выполнялся, принимая batch_size равным 4 из 32. Таким образом, использование меньшего batch_size было решением.

...