Графический процессор NVIDIA K-80 не работает с Tensorflow Deep Learning Image - PullRequest
0 голосов
/ 21 сентября 2018

Я создал виртуальную машину в Google Compute us-east-1c region со следующими характеристиками: n1-standard-2 (2 vCPU, 7,5 ГБ памяти), 1 GPU NVIDIA Tesla K80, загрузочный диск: Deep Learning Image Tensorflow1.10.1 m7 CUDA 9.2.

Когда я впервые вошел в систему, он попросил меня установить драйверы, и я согласился.Он выдал мне несколько предупреждающих сообщений, которые я не сохранил.

Я пытался обучить модель, полностью написанную на Keras, с TF backend.

Однако, судя по скорости и загрузке ЦП (оба схожик тому, что он делает на моем ноутбуке, медленно и использует почти все доступные процессоры), графический процессор не используется.

Это также подтверждается выводом TF:

2018-09-21 08: 39: 48.602158: I tenorflow / core / platform / cpu_feature_guard.cc: 141] Ваш ЦП поддерживает инструкции, которые этот двоичный файл TensorFlow не был скомпилирован для использования: AVX2 FMA

Он не упоминал ни одногоGPU.(Спасибо @Matias Valdenegro!)

В моей модели я не имел отношения к GPU с пониманием того, что TF позаботится об этом автоматически.

Есть идеи?

Большое спасибо.

Ответы [ 2 ]

0 голосов
/ 22 сентября 2018

Проблема была в том, что я использовал requirements.txt.

. Я создал его на своем ноутбуке с pip freeze, загрузил его на ВМ и использовал pip для установки всех требований.

Таким образом, мой requirements.txt включает тензор потока.В результате pip установил версию репозитория, которая не включала поддержку графического процессора, заменив предварительно установленный тензорный поток поддержкой графического процессора.

Мне удалось выяснить это, повторив мои шаги и проверив наличие у графического процессора в секунду предложения @Shintlor (спасибо!) По пути.

Я создал другую виртуальную машину и не использовал require.txt;скорее я установил все недостающие пакеты один за другим.После этого моя модель тренируется в 20 раз быстрее, чем на моем ноутбуке.

0 голосов
/ 21 сентября 2018

Чтобы проверить, используется ли графический процессор, вы можете проверить вывод

watch -n 0.5 nvidia-smi

во время тренировки и посмотреть, есть ли запущенные процессы.

Вы также можете проверить вывод

import tensorflow as tf
tf.Session(config=tf.ConfigProto(log_device_placement=True))

и проверьте использование графического процессора.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...