ядро умирает всякий раз, когда я пытаюсь использовать ресурс gpu с помощью keras.
Вот код, который убивает мое ядро.
Я просто попытался запустить простой пример MNIST, чтобы проверить, могу ли я использовать GPU ресурс.
import keras.backend.tensorflow_backend as K
with K.tf.device('/device:XLA_GPU:1'):
model=Sequential()
model.add(Dense(256,input_dim=num_features))
model.add(Activation('relu'))
model.add(Dropout(0.45))
model.add(Dense(256, activation='relu'))
model.add(Dense(num_classes,activation='softmax'))
model.summary()
x_val=x_train[:10000]
partial_x_train=x_train[10000:]
y_val=y_train[:10000]
partial_y_train=y_train[10000:]
model.compile(loss='categorical_crossentropy',optimizer='adam', metrics=['accuracy'])
history=model.fit(partial_x_train, partial_y_train, epochs=10, batch_size=64,validation_data=(x_val,y_val))
history_out=history.history
history_out.keys()
Объем моей оперативной памяти составляет 128 ГБ.
Я прилагаю код и изображение, которые могут помочь в диагностике моей проблемы.
tf.test.is_built_with_cuda()
True
Я думаю, что получу Вывод TRUE из приведенного ниже кода.
tf.test.is_gpu_available(cuda_only=False, min_cuda_compute_capability=None)
False
import keras
keras.backend.tensorflow_backend._get_available_gpus()
[]
from tensorflow.python.client import device_lib
device_lib.list_local_devices()
[name: "/device:CPU:0"
device_type: "CPU"
memory_limit: 268435456
locality {
}
incarnation: 17500882871237650233,
name: "/device:XLA_CPU:0"
device_type: "XLA_CPU"
memory_limit: 17179869184
locality {
}
incarnation: 7435472842669374279
physical_device_desc: "device: XLA_CPU device",
name: "/device:XLA_GPU:0"
device_type: "XLA_GPU"
memory_limit: 17179869184
locality {
}
incarnation: 16650519670367446003
physical_device_desc: "device: XLA_GPU device",
name: "/device:XLA_GPU:1"
device_type: "XLA_GPU"
memory_limit: 17179869184
locality {
}
incarnation: 3646103247077884211
physical_device_desc: "device: XLA_GPU device",
name: "/device:XLA_GPU:2"
device_type: "XLA_GPU"
memory_limit: 17179869184
locality {
}
incarnation: 18164016521296166371
physical_device_desc: "device: XLA_GPU device"]
Я не уверен, совместимы ли мои версии tenorflow, CUDA и CUDNN друг с другом.
tf.__version__
'1.15.0'