Я хочу обучить детектор объектов, используя модель SSD MobileNet v2 API Tensorflow API, на относительно большом наборе данных (~ 3000 изображений для обучения и ~ 500 для тестирования).Я успешно выполнил все необходимые этапы предварительной обработки, создал train.record и test.record и попытался запустить обучение модели с помощью train.py , но процесс обучения был убит ядром.
>INFO:tensorflow:Restoring parameters from /home/yurii/.../second_attempt/model.ckpt
>INFO:tensorflow:Restoring parameters from /home/yurii/.../second_attempt/model.ckpt
>INFO:tensorflow:Running local_init_op.
>INFO:tensorflow:Running local_init_op.
>INFO:tensorflow:Done running local_init_op.
>INFO:tensorflow:Done running local_init_op.
>INFO:tensorflow:Starting Session.
>INFO:tensorflow:Starting Session.
>INFO:tensorflow:Saving checkpoint to path /home/yurii/.../second_attempt/model.ckpt
>INFO:tensorflow:Saving checkpoint to path /home/yurii/.../second_attempt/model.ckpt
>INFO:tensorflow:Starting Queues.
>INFO:tensorflow:Starting Queues.
>Killed
Я нашел некоторую информацию, утверждая, что проблема может быть из-за нехватки ОЗУ на моей машине.Ранее я обучал модель на меньшем наборе данных (280 изображений для обучения и 40 для тестирования), и все работало правильно.Итак, примерно, сколько оперативной памяти мне нужно для обучения MobileNet в моем наборе данных?Я использую Asus X555L с доступной оперативной памятью 4 Гб, графический процессор - Nvidia GeForce 920M (2 Гб, вычислительная емкость 3,5), версия CUDA - 9.0.176, версия cudnn - 7.5, версия tenenflow - 1.7.0, версия драйвера Nvidia - 384.130