Ядро умирает всякий раз, когда я пытаюсь использовать ресурс GPU с помощью Keras - PullRequest
0 голосов
/ 17 апреля 2020

ядро ​​умирает всякий раз, когда я пытаюсь использовать ресурс gpu с помощью keras.

Вот код, который убивает мое ядро.

Я просто попытался запустить простой пример MNIST, чтобы проверить, могу ли я использовать GPU ресурс.

import keras.backend.tensorflow_backend as K
with K.tf.device('/device:XLA_GPU:1'):
    model=Sequential()
    model.add(Dense(256,input_dim=num_features)) 
    model.add(Activation('relu'))
    model.add(Dropout(0.45))
    model.add(Dense(256, activation='relu'))
    model.add(Dense(num_classes,activation='softmax'))
    model.summary()
    x_val=x_train[:10000]
    partial_x_train=x_train[10000:]
    y_val=y_train[:10000]
    partial_y_train=y_train[10000:]

    model.compile(loss='categorical_crossentropy',optimizer='adam', metrics=['accuracy'])
    history=model.fit(partial_x_train, partial_y_train, epochs=10, batch_size=64,validation_data=(x_val,y_val))
    history_out=history.history
    history_out.keys()

Объем моей оперативной памяти составляет 128 ГБ.

Я прилагаю код и изображение, которые могут помочь в диагностике моей проблемы.

tf.test.is_built_with_cuda()

True

Я думаю, что получу Вывод TRUE из приведенного ниже кода.

tf.test.is_gpu_available(cuda_only=False, min_cuda_compute_capability=None)

False
import keras
keras.backend.tensorflow_backend._get_available_gpus()

[]
from tensorflow.python.client import device_lib
device_lib.list_local_devices()


[name: "/device:CPU:0"
 device_type: "CPU"
 memory_limit: 268435456
 locality {
 }
 incarnation: 17500882871237650233,
 name: "/device:XLA_CPU:0"
 device_type: "XLA_CPU"
 memory_limit: 17179869184
 locality {
 }
 incarnation: 7435472842669374279
 physical_device_desc: "device: XLA_CPU device",
 name: "/device:XLA_GPU:0"
 device_type: "XLA_GPU"
 memory_limit: 17179869184
 locality {
 }
 incarnation: 16650519670367446003
 physical_device_desc: "device: XLA_GPU device",
 name: "/device:XLA_GPU:1"
 device_type: "XLA_GPU"
 memory_limit: 17179869184
 locality {
 }
 incarnation: 3646103247077884211
 physical_device_desc: "device: XLA_GPU device",
 name: "/device:XLA_GPU:2"
 device_type: "XLA_GPU"
 memory_limit: 17179869184
 locality {
 }
 incarnation: 18164016521296166371
 physical_device_desc: "device: XLA_GPU device"]

Я не уверен, совместимы ли мои версии tenorflow, CUDA и CUDNN друг с другом.

tf.__version__

'1.15.0'

enter image description here

enter image description here

...