Как я могу повысить точность моей модели классификации изображений Keras в Python? - PullRequest
0 голосов
/ 24 апреля 2018

Я пытаюсь классифицировать группу изображений пчел на два класса - шмель и медоносная пчела, и в результате получается формат CSV-файла, подобный -

идентификатор, bumble_bee, honey_bee

20000,0,75, 0,25.

У меня есть работающая модель, но точность очень низкая, и я пробовал кучу разных вещей, таких как добавление base_model, такого как VGG16 или InceptionV3, настройка эпох, настройка типа оптимизатора ... и у меня просто нет не заметил большой разницы. Все мои изменения все еще приводят к точности около 70-79%.

Как повысить точность моей модели?

Вот мой код:

from keras.preprocessing.image import ImageDataGenerator
from keras.models import Sequential
from keras.layers import Conv2D, MaxPooling2D
from keras.layers import Activation, Dropout, Flatten, Dense
from keras import backend as K

# dimensions of our images.
img_width, img_height = 200, 200

train_data_dir = 'data/train/'
validation_data_dir = 'data/validation/'
nb_train_samples = 2978
nb_validation_samples = 991
epochs = 50
batch_size = 25

if K.image_data_format() == 'channels_first':
    input_shape = (3, img_width, img_height)
else:
    input_shape = (img_width, img_height, 3)

model = Sequential()
model.add(Conv2D(32, (3, 3), input_shape=input_shape))
model.add(Activation('relu'))
model.add(MaxPooling2D(pool_size=(2, 2)))

model.add(Conv2D(32, (3, 3)))
model.add(Activation('relu'))
model.add(MaxPooling2D(pool_size=(2, 2)))

model.add(Conv2D(64, (3, 3)))
model.add(Activation('relu'))
model.add(MaxPooling2D(pool_size=(2, 2)))

model.add(Flatten())
model.add(Dense(64))
model.add(Activation('relu'))
model.add(Dropout(0.5))
model.add(Dense(2))
model.add(Activation('softmax'))

model.compile(loss='categorical_crossentropy',
              optimizer=optimizers.SGD(lr=1e-4, momentum=0.9),
              metrics=['accuracy'])

# this is the augmentation configuration we will use for training
train_datagen = ImageDataGenerator(
    rescale=1. / 255,
    shear_range=0.2,
    zoom_range=0.2,
    horizontal_flip=True)

# this is the augmentation configuration we will use for testing:
# only rescaling
test_datagen = ImageDataGenerator(rescale=1. / 255)

train_generator = train_datagen.flow_from_directory(
    train_data_dir,
    target_size=(img_width, img_height),
    batch_size=batch_size,
    class_mode='categorical')

validation_generator = test_datagen.flow_from_directory(
    validation_data_dir,
    target_size=(img_width, img_height),
    batch_size=batch_size,
    class_mode='categorical')

model.fit_generator(
    train_generator,
    steps_per_epoch=nb_train_samples // batch_size,
    epochs=epochs,
    validation_data=validation_generator,
    validation_steps=nb_validation_samples // batch_size)

model.save_weights('thirdtry.h5')

pred = model.predict(pred_images)
np.savetxt('resultsfrom3no.csv',pred)

Вот пример его вывода:

Найдено 2978 изображений, относящихся к 2 классам. Найдено 991 изображений принадлежащих 2 классам.

Эпоха 1/50 119/119 [=============================] - 238 с 2 с / шаг - потери: 0,5570 - в соответствии с 0,7697 - потери по величине: 0,5275 - val_acc: 0,7908

Эпоха 2/50 119/119 [=============================] - 237 с 2 с / шаг - потеря: 0,5337 - согласно: 0,7894 - val_loss: 0,5270 - val_acc: 0,7908

Эпоха 3/50 119/119 [=============================] - 282 с 2 с / шаг - потеря: 0,5299 - согласно: 0,7939 - val_loss: 0,5215 - val_acc: 0,7908

1 Ответ

0 голосов
/ 16 июня 2018

Используйте предварительно обученную сеть VGGNet для извлечения объектов и создайте свой классификатор поверх него с помощью плотных слоев. Вы должны установить размер изображения (ш х ч) для исходного сетевого ввода.

Поскольку у вас есть только два класса, будет лучше использовать режим двоичного класса для генераторов данных, двоичную кросс-энтропию в качестве функции потерь и сигмоид в качестве функции окончательной активации.

Сначала попробуйте без быстрого увеличения данных для быстрого теста, а затем используйте увеличение, чтобы посмотреть, поможет ли это.

Во время обучения вашей сети классификатора начните с соответственно высокой скорости обучения (например, 0,001) и поэкспериментируйте с более низкими показателями (1e-4, 1e-5 и т. Д. ...), если значение акклиматизации остается неизменным.

Также в вашем коде, вероятно, поможет снижение скорости обучения и игра со значением импульса.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...