API обнаружения объектов TensorFlow Mask-RCNN вызывает ошибки OOM - PullRequest
0 голосов
/ 06 декабря 2018

Я пытаюсь обучить модель Mask-RCNN (ResNet101) на одном графическом процессоре, используя API обнаружения объектов TensorFlow.

Эта конфигурация, которую я использую для Mask-RCNN .

Сразу после начала обучения требуется ~ 24 ГБ ОЗУ процессора.На 10-минутной отметке, когда начинается первый раунд оценки, все 32 ГБ ОЗУ моего ЦП заполняются, и процесс останавливается.

Мой набор данных состоит из 1 образца в обучающем наборе (то есть 1 изображение) и1 образец в наборе eval.Изображения 775 х 522 пикселей.Каждый образец (изображение + коробки + маски) составляет не более 2 МБ на диске.Я сделал это, чтобы свести к минимуму влияние набора данных на потребление памяти.

Я также попытался обучить модель Faster RCNN для того же набора данных, и она работает как положено (используя 2-3 ГБ)ОЗУ процессора).

Это конфигурация, которую я использую для Faster RCNN

Почему использование памяти во время обучения и оценки Mask-RCNN так высоко(по сравнению с более быстрыми RCNN), и что я могу сделать, чтобы уменьшить его?

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...