Запуск предварительно обученной модели нейронной сети разрушает всю систему - PullRequest
0 голосов
/ 24 апреля 2018

Я довольно новичок в машинном обучении и пытаюсь реализовать GAN из исходного кода здесь https://github.com/tkarras/progressive_growing_of_gans

Насколько я могу судить, у меня есть все зависимости, и я не получаю ошибок при запуске сценария импорта. Однако, когда я добираюсь до линии, отмеченной ниже, чтобы сгенерировать изображения из полученного генератора, моя система внезапно отключается.

Я не получаю журналы ошибок или системные события, кроме потери питания ядра. Я протестировал некоторые примеры утилит CUDA для тестирования пропускной способности и устройств, и это, похоже, не вызывает проблем, что заставляет меня думать, что это не аппаратная проблема.

import pickle
import numpy as np
import tensorflow as tf
import PIL.Image

# Initialize TensorFlow session.
tf.InteractiveSession()

# Import official CelebA-HQ networks.
with open('karras2018iclr-celebahq-1024x1024.pkl', 'rb') as file:
    G, D, Gs = pickle.load(file)

# Generate latent vectors.
latents = np.random.RandomState(1000).randn(1000, *Gs.input_shapes[0][1:]) # 1000 random latents
latents = latents[[477, 56, 83, 887, 583, 391, 86, 340, 341, 415]] # hand-picked top-10

# Generate dummy labels (not used by the official networks).
labels = np.zeros([latents.shape[0]] + Gs.input_shapes[1][1:])

# Run the generator to produce a set of images.
!!!!!!!!!!!SYSTEM CRASHES ON THIS INSTRUCTION!!!!!!!!!!!!!!!!
images = Gs.run(latents, labels)

# Convert images to PIL-compatible format.
images = np.clip(np.rint((images + 1.0) / 2.0 * 255.0), 0.0, 255.0).astype(np.uint8) # [-1,1] => [0,255]
images = images.transpose(0, 2, 3, 1) # NCHW => NHWC

# Save images as PNG.
for idx in range(images.shape[0]):
    PIL.Image.fromarray(images[idx], 'RGB').save('img%d.png' % idx)

Однако у меня возникла та же проблема потери мощности при запуске другой реализации ML, в которой использовался Caffee. Так что в данный момент я не знаю, в чем может быть основная проблема. Буду очень признателен за любые идеи о том, что еще я могу проверить.

Технические характеристики системы

  • -Windows 7
  • -2x - Intel Xeon CPU X5680 3,33 ГГц
  • -2x - графические процессоры Nvidia Quadro M6000
  • -24 Гб памяти
  • -1250 Вт блок питания

  • -Miciconda 3 с питоном версии 3.6.4

  • -CUDA версия 9.0
  • -CUDNN версия 7
  • -Tensorflow_gpu версия 1.7
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...