Как предварительно обработать и передать данные в модель keras? - PullRequest
1 голос
/ 23 октября 2019

У меня есть набор данных с двумя столбцами, путь и класс. Я хотел бы настроить VGGface с ним.

dataset.head(5):


    path            class
0   /f3_224x224.jpg red
1   /bc_224x224.jpg orange
2   /1c_224x224.jpg brown
3   /4b_224x224.jpg red
4   /0c_224x224.jpg yellow

Я хотел бы использовать эти пути для предварительной обработки изображений и подачи в керасы. Мои функции предварительной обработки приведены ниже:

from keras.preprocessing.image import img_to_array, load_img

def prep_image(photo):
    img = image.load_img(path + photo, target_size=(224, 224))
    x = image.img_to_array(img)
    x = np.expand_dims(x, axis=0)
    x = utils.preprocess_input(x, version=1)
    return x

Я готовлю свои наборы данных с помощью следующего кода:

from sklearn.model_selection import train_test_split

path = list(dataset.columns.values)
path.remove('class')
X = dataset[path]
y = dataset['class']

X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.3, random_state=0)

Я тренирую свою модель со следующим кодом:

nb_class = 4
hidden_dim = 512

vgg_model = VGGFace(include_top=False, input_shape=(224, 224, 3))
last_layer = vgg_model.get_layer('pool5').output
x = Flatten(name='flatten')(last_layer)
x = Dense(hidden_dim, activation='relu', name='fc6')(x)
x = Dense(hidden_dim, activation='relu', name='fc7')(x)
out = Dense(nb_class, activation='softmax', name='fc8')(x)
custom_vgg_model = Model(vgg_model.input, out)
custom_vgg_model.compile(

        optimizer="adam",
        loss="categorical_crossentropy"
    )

custom_vgg_model.fit(X_train, y_train, epochs=50, batch_size=16)
test_loss, test_acc = model.evaluate(X_test, y_test)

Однако я получаю ошибку значения, потому что я не могу понять, как предварительно обрабатывать изображения и подавать массивы. Как я могу преобразовать пути из X_train / test dataframes и заменить их выводом функции prep_image?

ValueError: Error when checking input: expected input_2 to have 4 dimensions, but got array with shape (50297, 1)

Таким образом, форма должна быть (50297, 224, 224, 3).

1 Ответ

3 голосов
/ 23 октября 2019

X_train, X_test - это, по сути, просто имена путей. На этапе подготовки данных вам просто нужно изменить код, добавив эти две последние строки.

from sklearn.model_selection import train_test_split

path = list(dataset.columns.values)
path.remove('class')
X = dataset[path]
y = dataset['class']

X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.3, random_state=0)
X_train = np.array([prep_image(path)[0] for path in X_train])
X_test = np.array([prep_image(path)[0] for path in X_test])
...