Я пытаюсь выяснить, как использовать подмножество изображений в каталогах, чтобы проверить, действительно ли больший набор данных поможет мне классифицировать некоторые изображения (а для контекста они являются неясными изображениями с кажущимися случайными каплями (но онина самом деле не случайные), а не формы, которые человек может различить на глаз).Я использую ImageDataGenerator с потоком из каталога в Keras, и поэтому хотел бы проверить это на различных объемах данных.
Это простой код, который я до сих пор извлекал из каталогов, используя генераторы.
def load_the_data(batch_size):
train_datagen = ImageDataGenerator(
rescale=1./255,
horizontal_flip=True,
rotation_range=50,
validation_split=0.6,
)
train_generator = train_datagen.flow_from_directory(
train_data_dir,
target_size=(21, 21),
batch_size=batch_size,
class_mode='categorical',
subset='training'
)
validation_generator = train_datagen.flow_from_directory(
train_data_dir, # same directory as training data
target_size=(21, 21),
batch_size=batch_size,
class_mode='categorical',
subset='validation'
)
return train_datagen, train_generator, validation_generator