Я тренируюсь с GPU? - PullRequest
       10

Я тренируюсь с GPU?

0 голосов
/ 12 февраля 2019

Я тренирую нейронную модель с керасом и тензорным потоком в качестве бэкэнда.Файл журнала начинается со следующего сообщения:

nohup: ignoring input
2019-02-12 17:44:29.414526: I tensorflow/core/platform/cpu_feature_guard.cc:141] Your CPU supports instructions that this TensorFlow binary was not compiled to use: AVX2 AVX512F FMA
2019-02-12 17:44:30.191565: I tensorflow/core/common_runtime/gpu/gpu_device.cc:1405] Found device 0 with properties: 
name: GeForce GTX 1080 major: 6 minor: 1 memoryClockRate(GHz): 1.7335
pciBusID: 0000:65:00.0
totalMemory: 7.93GiB freeMemory: 7.81GiB
2019-02-12 17:44:30.191601: I tensorflow/core/common_runtime/gpu/gpu_device.cc:1484] Adding visible gpu devices: 0
2019-02-12 17:44:30.409790: I tensorflow/core/common_runtime/gpu/gpu_device.cc:965] Device interconnect StreamExecutor with strength 1 edge matrix:
2019-02-12 17:44:30.409828: I tensorflow/core/common_runtime/gpu/gpu_device.cc:971]      0 
2019-02-12 17:44:30.409834: I tensorflow/core/common_runtime/gpu/gpu_device.cc:984] 0:   N 
2019-02-12 17:44:30.410015: I tensorflow/core/common_runtime/gpu/gpu_device.cc:1097] Created TensorFlow device (/job:localhost/replica:0/task:0/device:GPU:0 with 7535 MB memory) -> physical GPU (device: 0, name: GeForce GTX 1080, pci bus id: 0000:65:00.0, compute capability: 6.1)

Означает ли это, что обучение выполняется на GPU?

Я бы сказал, что да, но когда я выполняю nvtop, я вижу, что используется вся память GPU, когда используется 0% емкости вычислений GPU (см. Желтый снимок экрана ниже):

see screenshot

Также, когда я набираю htop в командной строке, я вижу, что один ЦП полностью используется (см. Черный скриншот ниже)

see screenshot

Почему используется память GPU, а вместо вычисления емкости GPU используется расчет производительности процессора?

1 Ответ

0 голосов
/ 12 февраля 2019

Я думаю, что вы скомпилировали (или вы уже установили уже скомпилированный пакет) тензор потока с поддержкой CUDA, но не с поддержкой всех инструкций, доступных для вашего процессора (ваш процессор поддерживает инструкции AVX2, AVX512F и FMA, которые может использовать тензор потока).

Это означает, что тензор потока будет работать нормально (с полной поддержкой графического процессора), но вы не можете использовать свой процессор на полную мощность.

Попробуйте сравнить время (GPU и CPU) с этим примером: https://stackoverflow.com/a/54661896/10418812

...