Я читал много форумов, нет четкого ответа. Во многих местах говорят, что он выбирает последние 20% для нашего примера из данных. Скажем, наши данные в двух папках Cats и Dogs ... так что, если выбрать только последние 20% данных из папки Dogs и ни одной из кошек, разве это не так? , Могут ли керасы сделать такую ошибку в этом коде Можете ли вы заверить, что данные, выбранные keras для проверки, имеют одинаковую долю изображений из каждого класса.
datagen = ImageDataGenerator(rescale=1./255, validation_split=0.2)
print("Preparing training dataset...")
train_generator = datagen.flow_from_directory(
training_folder_name,
target_size=pretrained_size,
batch_size=batch_size,
class_mode='categorical',
subset='training') # set as training data
print("Preparing validation dataset...")
validation_generator = datagen.flow_from_directory(
training_folder_name,
target_size=pretrained_size,
batch_size=batch_size,
class_mode='categorical',
subset='validation') # set as validation data
Вывод: Подготовка набора учебных данных ... Найдено 3357 изображений, относящихся к 3 классам. Подготовка набора проверочных данных ... Найдено 838 изображений, относящихся к 3 классам.
Эти 838 изображений имеют одинаковую долю от каждого класса?