Указание 3 графических процессоров (среди 4 на машине) с использованием Keras и Tensorflow - PullRequest
0 голосов
/ 20 марта 2019

Я выполняю глубокое обучение на моей машине, которая имеет 4 графических процессора. Во время обучения третий GPU постоянно теряется (появляется ошибка «GPU lost», и в журналах указывается, что это именно этот GPU). Я предполагаю, что это тепловая проблема, и графический процессор становится неактивным.

Прежде чем исправить эту аппаратную проблему, я хотел бы продолжить использование 3 графических процессоров ('/ gpu: 0', '/ gpu: 1', '/ gpu: 3'). Есть ли способ указать в Keras, что это те графические процессоры, которые я хочу использовать (или, альтернативно, игнорировать '/ gpu: 2')?

Я много видел при указании использования графического процессора в сравнении с использованием процессора и указании одного графического процессора на компьютере с несколькими графическими процессорами, но не об этой конкретной проблеме (выделил ряд конкретных графических процессоров). Большое спасибо.

1 Ответ

2 голосов
/ 20 марта 2019

Вы можете попробовать использовать CUDA_VISIBLE_DEVICES Environment

import os
os.environ['CUDA_VISIBLE_DEVICES']="0,1,3"

Возможно, установите это перед импортом keras / tf.

...