Я пытаюсь обучить сеть Vigg19 с Детализированной визуальной классификацией самолетов набор данных для эталонных тестов. Я выбрал 3 самолета семейства. Используя текстовые файлы, которые даны в наборе данных, мне удается построить фрейм данных, чтобы использовать генератор flow_from_dataframe.
df = pd.read_csv("./train_family.csv")
df_test = pd.read_csv("./test_family.csv")
datagen=ImageDataGenerator(rescale=1./255.,validation_split=0.25,rotation_range=10, horizontal_flip=True, vertical_flip=True)
train_generator=datagen.flow_from_dataframe(dataframe=df,
directory="./data/images",
x_col="train", y_col="labels",
class_mode="categorical", target_size=(224,224), batch_size=8, seed = 19, shuffle = True, color_mode = "rgb",
subset = "training")
valid_generator=datagen.flow_from_dataframe(dataframe=df,
directory="./data/images",
x_col="train", y_col="labels",
class_mode="categorical", target_size=(224,224), batch_size=8, seed = 19, shuffle = True, color_mode = "rgb",
subset = "validation")
test_generator=datagen.flow_from_dataframe(dataframe=df_test,
directory="./data/images",
x_col="test", y_col="labels",
class_mode="categorical", target_size=(224,224), batch_size=8, seed = 19, shuffle = False, color_mode = "rgb")
При подборе модели алгоритм всегда дает одинаковую точность проверки, равную «1»
потери: 5,5803 - в соответствии с: 0,6538 - потери по val_1: 1.1921e-07 - val_acc: 1.0000
Я немного покопался, возможно, проблема вызвана количеством данных в моих наборах train / val / test. Ниже вы можете видеть выходные данные генератора для набора поездов, проверки и тестирования соответственно.
Found 550 images belonging to 3 classes.
Found 183 images belonging to 3 classes.
Found 367 images belonging to 3 classes.
Должен ли я увеличить набор поездов, уменьшив набор тестов?
Спасибо