Сколько изображений добавляет метод DataAugmentation в мой набор данных? (CNN KERAS) - PullRequest
1 голос
/ 05 ноября 2019

Я выполнил увеличение данных в моем двоичном CNN. В моем исходном наборе данных у меня 1400 изображений (по 700 в каждом классе), поэтому я сомневаюсь, когда я реализую увеличение данных (ниже), сколько изображений этот метод добавляет в мой набор данных?

datagen = ImageDataGenerator(
    rotation_range=30,
    zoom_range=0.15,
    featurewise_std_normalization=True,
    width_shift_range=0.2,
    height_shift_range=0.2,
    shear_range=0.15,
    horizontal_flip=True,
    fill_mode="nearest")

1 Ответ

1 голос
/ 05 ноября 2019

Keras ImageDataGenerator не добавляет изображений в набор данных, он просто случайным образом изменяет изображений из набора данных по мере необходимости. Каждый раз, когда вы запрашиваете пакет, он выбирает несколько неизмененных изображений из набора данных и затем изменяет их. Поскольку он выполняет случайные модификации, он может создавать почти бесконечное количество вариаций любого данного исходного изображения.

Если у вас есть 1400 изображений, скажем, вы получите точность проверки 90%. Если вы выполните аугментации для них, вы можете получить 93%. Однако имейте в виду, что увеличение не является хорошей заменой для большого набора данных. Если вы соберете еще 1400 изображений, то сможете получить 95% даже без какого-либо увеличения. Это происходит потому, что новые изображения являются совершенно новыми, поэтому они, вероятно, имеют функции, которые нельзя добавить с помощью стандартного дополнения.

...