Почему тензор потока на виртуальной машине Google с глубоким обучением не использует графический процессор? - PullRequest
0 голосов
/ 22 декабря 2018

Я использую виртуальную машину глубокого обучения Google из магазина Google Marketplace и выбрал графический процессор NvdiaK80.Я пытаюсь обучить модель обнаружения объекта с использованием API обнаружения объекта.Тем не менее, я заметил, что тензор потока по умолчанию не использует графический процессор (код для проверки приведен ниже)

Я предполагаю, что этот экземпляр поставляется со всеми необходимыми драйверами NVIDIA, так что это не проблема, связанная с драйвером.

Дальнейшие исследования показали, что у меня было 2 установки Tensorflow (tenorflow 1.12.0 и tenorflow-GPU 1.12.0).Поэтому я удалил версию процессора.Однако это все равно не помогает.

Я использовал приведенный ниже код, чтобы проверить, использует ли tenorflow графический процессор

from tensorflow.python.client import device_lib
print(device_lib.list_local_devices())

Для справки, я использую приведенный ниже код для обучения обнаружению объектов, которое выполняетсяхорошо для глубокого изучения VM, но не использует GPU.

python $Tensor_path/legacy/train.py --logtostderr -- 
train_dir=$Train_path/training/ -- 
pipeline_config_path=$Train_path/training/
ssd_inception_v2_pets.config

Вывод (я бы ожидал, что специфика используемого устройства GPU)

[name: "/cpu:0"
device_type: "CPU"
memory_limit: 268435456
locality {
}
incarnation: 18292259467280600161
]

1 Ответ

0 голосов
/ 24 декабря 2018

Мне удалось решить эту проблему, удалив старый экземпляр и начав заново с нового экземпляра.Я думаю, что установка tenorflow GPU была повреждена при установке API обнаружения объектов.Выполните следующие действия, чтобы установить https://cloud.google.com/solutions/creating-object-detection-application-tensorflow

И, скорее всего, эта строка является виновником

pip install --upgrade 
https://storage.googleapis.com/tensorflow/linux/cpu/tensorflow-1.1.0-cp27-none- 
linux_x86_64.whl
...