Неправильный порядок графического процессора в mxnet и тензорном потоке - PullRequest
0 голосов
/ 13 декабря 2018

На моем настольном компьютере установлено 2 графических процессора: 1080 и 1080Ti nvidia-smi показывает, что gpu-0 - это 1080, а gpu-1 - 1080Ti

+-----------------------------------------------------------------------------+
| NVIDIA-SMI 410.79       Driver Version: 410.79       CUDA Version: 10.0     |
|-------------------------------+----------------------+----------------------+
| GPU  Name        Persistence-M| Bus-Id        Disp.A | Volatile Uncorr. ECC |
| Fan  Temp  Perf  Pwr:Usage/Cap|         Memory-Usage | GPU-Util  Compute M. |
|===============================+======================+======================|
|   0  GeForce GTX 1080    Off  | 00000000:01:00.0 Off |                  N/A |
| 26%   57C    P2    53W / 215W |    696MiB /  8119MiB |      0%      Default |
+-------------------------------+----------------------+----------------------+
|   1  GeForce GTX 108...  Off  | 00000000:02:00.0 Off |                  N/A |
| 55%   70C    P2   204W / 250W |   8641MiB / 11178MiB |     28%      Default |
+-------------------------------+----------------------+----------------------+

В данный момент оба тензор потока и mxnet использовать в обратном порядке: 1080ti, когда я указываю gpu = 0, и 1080, когда я указываю gpu = 1.

Почему это происходит и как синхронизировать заказ тензорного потока и mxnet gpu с nvidia-smi gpu order?

Фрагменты кода для mxnet:

mod = mx.mod.Module(symbol, label_names=None, context=mx.gpu(0))

Для тензорного потока я использую переменную окружения

CUDA_VISIBLE_DEVICES="0"   

1 Ответ

0 голосов
/ 13 декабря 2018

Набор

export CUDA_DEVICE_ORDER=PCI_BUS_ID.

Также см. этот вопрос

...