Пустой вывод сверточного автоэнкодера Keras - PullRequest
0 голосов
/ 30 ноября 2018

Быстрый отказ от ответственности: я довольно новичок в Keras, машинном обучении и программировании в целом.

Я пытаюсь создать базовый авто-кодер для (в настоящее время) одного изображения.Хотя кажется, что он работает нормально, на выходе это просто белое изображение.Вот что у меня есть:

img_height, img_width = 128, 128

input_img = '4.jpg'
output_img = '5.jpg'

# load image
x = load_img(input_img)
x = img_to_array(x)  # array with shape (128, 128, 3)
x = x.reshape((1,) + x.shape)  # array with shape (1, 128, 128, 3)

# define input shape
input_shape = (img_height, img_width, 3)

model = Sequential()
# encoding
model.add(Conv2D(128, (3, 3), activation='relu', input_shape=input_shape, 
padding='same'))
model.add(MaxPooling2D(pool_size=(2,2)))
model.add(Conv2D(64, (3, 3), activation='relu', padding='same'))
model.add(MaxPooling2D(pool_size=(2,2)))
model.add(Conv2D(64, (3, 3), activation='relu', padding='same'))

# decoding
model.add(Conv2D(64, (3, 3), activation='relu', padding='same'))
model.add(UpSampling2D(size=(2,2)))
model.add(Conv2D(64, (3, 3), activation='relu', padding='same'))
model.add(UpSampling2D(size=(2,2)))
model.add(Conv2D(128, (3, 3), activation='relu', padding='same'))
model.add(Conv2D(3, (3, 3), activation='sigmoid', padding='same'))

model.compile(loss='binary_crossentropy', optimizer='adam')
print(model.summary())

checkpoint = ModelCheckpoint("autoencoder-loss-{loss:.4f}.hdf5", monitor='loss', verbose=0, save_best_only=True, mode='min') 
model.fit(x, x, epochs=10, batch_size=1, verbose=1, callbacks=[checkpoint])

y = model.predict(x)

y = y[0, :, :, :]
y = array_to_img(y)
save_img(output_img, y)

Я просмотрел несколько учебников для справки, но я до сих пор не могу понять, в чем заключается моя проблема.

Любое руководство /предложения / помощь будет принята с благодарностью.

Спасибо!

1 Ответ

0 голосов
/ 30 ноября 2018

это решило проблему.Код просто отсутствовал

x = x.astype('float32') / 255.

Это встроенная встроенная функция для преобразования значений, содержащихся в этом векторе, в числа с плавающей точкой.

Это позволяет нам получить десятичные значения, где значения делятся на 255. Значения RGB хранятся как 8-битные целые числа, поэтому мы делим значения в векторе на 255 (2 ^ 8 - 1), чтобыпредставлять цвет в виде десятичного значения от 0,0 до 1,0.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...