ValueError: Ошибка при проверке ввода: ожидалось, что conv2d_3_input будет иметь форму (100, 100, 1), но получил массив с формой (100, 100, 3) - PullRequest
1 голос
/ 11 января 2020

Когда я пытаюсь закодировать нейронную сеть для распознавания изображений, я получаю ошибку:

ValueError: Ошибка при проверке ввода: ожидалось, что conv2d_3_input имеет форму (100, 100, 1), но получил массив с формой (100, 100, 3).

Все мои изображения greyscale с размером 100x100 пикселей. Вот код:

# Importing the Keras libraries and packages
import tensorflow as tf
from keras.models import Sequential
from keras.layers import Conv2D
from keras.layers import MaxPooling2D
from keras.layers import Flatten
from keras.layers import Dense
# Initialising the CNN
classifier = Sequential()
# Step 1 - Convolution
classifier.add(Conv2D(32, (3, 3), input_shape = (100, 100, 1), activation = 'relu'))
# Step 2 - Pooling
classifier.add(MaxPooling2D(pool_size = (2, 2)))
# Adding a second convolutional layer
classifier.add(Conv2D(32, (3, 3), activation = 'relu'))
classifier.add(MaxPooling2D(pool_size = (2, 2)))
# Step 3 - Flattening
classifier.add(Flatten())
# Step 4 - Full connection
classifier.add(Dense(units = 128, activation = 'relu'))
classifier.add(Dense(units = 1, activation = 'sigmoid'))
# Compiling the CNN
classifier.compile(optimizer = 'adam', loss = 'binary_crossentropy', metrics = ['accuracy'])
# Part 2 - Fitting the CNN to the images
from keras.preprocessing.image import ImageDataGenerator
train_datagen = ImageDataGenerator(rescale = 1./255,
shear_range = 0.2,
zoom_range = 0.2,
horizontal_flip = True)
test_datagen = ImageDataGenerator(rescale = 1./255)
training_set = train_datagen.flow_from_directory('E:/exercise/dataset/train',
target_size = (100, 100),
batch_size = 32,
color_mode = "grayscale",
class_mode = 'binary')
test_set = test_datagen.flow_from_directory('E:/exercise/dataset/test',
target_size = (100, 100),
color_mode = "grayscale",
batch_size = 32,
class_mode = 'binary')
classifier.fit_generator(training_set,
steps_per_epoch = 40,
epochs = 10,                                                                                   
validation_data = test_set,
validation_steps = 8)

import numpy as np
from keras.preprocessing import image                           
test_image = image.load_img('E:/exercise/predict_2.jpg', target_size = (100, 100))
test_image = image.img_to_array(test_image)
test_image = np.expand_dims(test_image, axis = 0)
result = classifier.predict(test_image)
training_set.class_indices                                   
if result[0][0] >= 0.5: prediction = 'happy'
else: prediction = 'sad'
print(prediction)  

Любой может показать мне, как решить эту проблему. Спасибо всем!

1 Ответ

0 голосов
/ 12 января 2020

Попробуйте добавить параметр preprocessing_function=gray_to_rgb к ImageDataGenerator для обоих train_datagen & test_datagen, как:

def rgb_to_gray(rgb):     # Using the luminosity formula: grayscale =  0.21 R + 0.72 G + 0.07 B
    return np.dot(rgb[...,:3], [0.299, 0.587, 0.114])

train_datagen = ImageDataGenerator(rescale = 1./255,
shear_range = 0.2,
zoom_range = 0.2,
horizontal_flip = True,
preprocessing_function=rgb_to_gray)
test_datagen = ImageDataGenerator(rescale = 1./255, preprocessing_function=rgb_to_gray)
...