Ядро, кажется, умерло.Он перезапустится автоматически.с проблемой памяти? - PullRequest
1 голос
/ 18 апреля 2019

ядро ​​умерло после запуска некоторого кодаЯ пытаюсь запустить код для генерации примера изображения с генератором. Я пытался обновить conda и Jupiter, но ни один из них не сработал.

Я продолжаю наблюдать за использованием памяти графическим процессором, но он не так часто использует графический процессор

тензор потока 2.0, ubuntu 18.10, cuda 10.0python 3.5,

def make_generator_model():
    model = tf.keras.Sequential()
    model.add(layers.Dense(7*7*256, use_bias=False, input_shape=(100,)))
    model.add(layers.BatchNormalization())
    model.add(layers.LeakyReLU())

    model.add(layers.Reshape((7, 7, 256)))
    assert model.output_shape == (None, 7, 7, 256) # Note: None is the batch size

    model.add(layers.Conv2DTranspose(128, (5, 5), strides=(1, 1), padding='same', use_bias=False))
    assert model.output_shape == (None, 7, 7, 128)
    model.add(layers.BatchNormalization())
    model.add(layers.LeakyReLU())

    model.add(layers.Conv2DTranspose(64, (5, 5), strides=(2, 2), padding='same', use_bias=False))
    assert model.output_shape == (None, 14, 14, 64)
    model.add(layers.BatchNormalization())
    model.add(layers.LeakyReLU())

    model.add(layers.Conv2DTranspose(1, (5, 5), strides=(2, 2), padding='same', use_bias=False, activation='tanh'))
    assert model.output_shape == (None, 28, 28, 1)

    return model
generator = make_generator_model()

noise = tf.random.normal([1, 100])
generated_image = generator(noise, training=False)

[I 10: 20: 06.664 NotebookApp] KernelRestarter: перезапуск ядра (1/5), сохранение случайных портов ВНИМАНИЕ: root: kernel 4406ce3b-1b5b-4ef8-aba9-d5fd9ed129e7 перезапущен 2019-04-18 10: 20: 21.002451: I tenorflow / stream_executor / platform / default / dso_loader.cc: 42] Успешно открытая динамическая библиотека libcuda.so.1 2019-04-18 10: 20: 21.081020: I tenorflow / core / common_runtime / gpu / gpu_device.cc: 1589] Найдено устройство 0 со свойствами: name: TITAN Xp major: 6 вспомогательных: 1 memoryClockRate (GHz): 1.582 pciBusID: 0000: 42: 00.0 totalMemory: 11.91GiB freeMemory: 340.69MiB 2019-04-18 10: 20: 21.081054: I tenorflow / core / common_runtime / gpu / gpu_device.cc: 1712] Добавление видимых устройств gpu: 0 2019-04-18 10: 20: 21.081382: I tenorflow / core/platform/cpu_feature_guard.cc:142] Ваш ЦП поддерживает инструкции, которые этот двоичный файл TensorFlow не был скомпилирован для использования: AVX2 FMA 2019-04-18 10: 20: 21.107510: Я тензор потока / компилятор / xla / service / service.cc: 168] Служба XLA 0x55de6ead0990 выполняет вычисленияна платформе CUDA.Устройства: 2019-04-18 10: 20: 21.107562: I tenorflow / compiler / xla / service / service.cc: 175] Устройство StreamExecutor (0): TITAN Xp, Compute Capability 6.1 2019-04-18 10: 20: 21.127890: I тензор потока / ядро ​​/ платформа / profile_utils / cpu_utils.cc: 94] Частота ЦП: 3493050000 Гц 2019-04-18 10: 20: 21.129460: Я тензор потока / компилятор / xla / service / service.cc: 168] Служба XLA 0x55de6eed7eb0выполнение вычислений на платформе Host.Устройства: 2019-04-18 10: 20: 21.129503: I tenorflow / compiler / xla / service / service.cc: 175] Устройство StreamExecutor (0):, 2019-04-18 10: 20: 21.129616: I tenorflow / core/common_runtime/gpu/gpu_device.cc:1712] Добавление видимых устройств gpu: 0 2019-04-18 10: 20: 21.129722: I tenorflow / stream_executor / platform / default / dso_loader.cc: 42] Успешно открылась динамическая библиотека libcudart.so.10.0 2019-04-18 10: 20: 21.130785: I tenorflow / core / common_runtime / gpu / gpu_device.cc: 1120] Взаимодействие устройства StreamExecutor с краевой матрицей прочности 1: 2019-04-18 10: 20: 21.130807: I tenorflow/core/common_runtime/gpu/gpu_device.cc:1126] 0 2019-04-18 10: 20: 21.130819: I tenorflow / core / common_runtime / gpu / gpu_device.cc: 1139] 0: N 2019-04-18 10:20: 21.131090: I tenorflow / core / common_runtime / gpu / gpu_device.cc: 1260] Создано устройство TensorFlow (/ job: localhost / replica: 0 / task: 0 / device: GPU: 0 с памятью 115 МБ) -> физический GPU(устройство: 0, имя: TITAN Xp, идентификатор шины pci: 0000: 42: 00.0, вычислительные возможности: 6.1) 2019-04-18 10: 20: 24.168083: I tenorflow / stream_executor / platform / default / dso_loader.cc: 42] Успешно открытая динамическая библиотека libcublas.so.10.0 2019-04-18 10: 20: 24.331094: I tenororflow / stream_executor / platform / default / dso_loader.cc:42] Успешно открытая динамическая библиотека libcudnn.so.7 2019-04-18 10: 20: 24.789774: E tenorflow / stream_executor / cuda / cuda_dnn.cc: 329] Не удалось создать дескриптор cudnn: CUDNN_STATUS_INTERNAL_ERROR 2019-04-18 10:20: 24.791468: E tenorflow / stream_executor / cuda / cuda_dnn.cc: 329] Не удалось создать дескриптор cudnn: CUDNN_STATUS_INTERNAL_ERROR 2019-04-18 10: 20: 24.791484: F tenorflow / core / kernels / conv_grad_input_ops.ops.cc: ошибка:stream-> parent () -> GetConvolveBackwardDataAlgorithms (conv_parameters.ShouldIncludeWinogradNonfusedAlgo (stream-> parent ()), & алгоритмы) [I 10: 20: 27.669 NotebookApp] KernelRestarter: перезапуск ядра (1/5), сохранить случайные порты ПРЕДУПРЕЖДЕНИЕ: root:ядро 4406ce3b-1b5b-4ef8-aba9-d5fd9ed129e7 перезапущено

1 Ответ

0 голосов
/ 18 апреля 2019

Судя по выводу ошибки, кажется, что это проблема с памятью.

"всего памяти: 11,91 гигабайтов свободного памяти: 340,69 миллионов гигабайт"

Попробуйте перезагрузить компьютер и, как только вы снова включите его, посмотрите, сколько ОЗУ доступно, а затем снова выполните ваш код и посмотрите, сработал ли он.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...