100% использование графического процессора на GCE без каких-либо процессов - PullRequest
0 голосов
/ 11 октября 2018

Я только что запустил экземпляр на Google Compute Engine с 2 графическими процессорами (Nvidia Tesla K80).И сразу после запуска через nvidia-smi я вижу, что один из них уже полностью использован.

Я проверил список запущенных процессов и ничего не работает вообще.Означает ли это, что Google сдал в аренду тот же самый графический процессор кому-то еще?

enter image description here

Все это работает на этой машине:

No LSB modules are available.
Distributor ID: Ubuntu
Description:    Ubuntu 16.04.5 LTS
Release:    16.04
Codename:   xenial

enter image description here

Ответы [ 2 ]

0 голосов
/ 27 ноября 2018

Включение «режима персистентности» с помощью nvidia-smi -pm 1 может решить проблему.ECC в сочетании с непостоянным режимом может привести к 100% использованию графического процессора.

В качестве альтернативы вы можете отключить ECC с помощью nvidia-smi -e 0.

Примечание. Я не уверен, что производительность на самом деле хуже,Я помню, что смог тренировать модель ML, несмотря на 100% использование графического процессора, но я не знаю, было ли это медленнее.

0 голосов
/ 18 октября 2018

Я хотел бы предложить вам сообщить о проблеме и создать ее в Google Issue Tracker, если необходимо провести расследование.Пожалуйста, укажите ваш номер проекта и имя экземпляра там.Пожалуйста, следуйте этому URL , чтобы вы могли создавать файлы как личные в Google Issue Tracker.

...