Керас - как передать массив изображений в ImageDataGenerator.flow - PullRequest
1 голос
/ 27 октября 2019

Я изучаю классификацию изображений в керасе. Я скачал образец набора пончиков и вафель, но они различаются по размеру. Чтобы стандартизировать их размер, я загружаю изображения из их каталогов, изменяю их размер и сохраняю их в виде массивов:

test_data_dir = 'v_data/train/donuts_and_waffles/'
validation_data_dir = 'v_data/test/donuts_and_waffles/'

loaded_test_donuts = list()
for filename in listdir(test_data_dir + 'donuts/'):
    image1 = Image.open(test_data_dir + 'donuts/' + filename)
    img_resized = image1.resize((224,224))
    img_data = asarray(img_resized)
    loaded_test_donuts.append(img_data)

loaded_test_waffles = list()
for filename in listdir(test_data_dir + 'waffles/'):
    image1 = Image.open(test_data_dir + 'waffles/' + filename)
    img_resized = image1.resize((224,224))
    img_data = asarray(img_resized)
    loaded_test_waffles.append(img_data)

loaded_validation_donuts = list()
for filename in listdir(validation_data_dir + 'donuts/'):
    image1 = Image.open(validation_data_dir + 'donuts/' + filename)
    img_resized = image1.resize((224,224))
    img_data = asarray(img_resized)
    loaded_validation_donuts.append(img_data)

loaded_validation_waffles = list()
for filename in listdir(validation_data_dir + 'waffles/'):
    image1 = Image.open(validation_data_dir + 'waffles/' + filename)
    img_resized = image1.resize((224,224))
    img_data = asarray(img_resized)
    loaded_validation_waffles.append(img_data)

test_data = list()
validation_data = list()

test_data.append(np.array(loaded_test_donuts))
test_data.append(np.array(loaded_test_waffles))
validation_data.append(np.array(loaded_validation_donuts))
validation_data.append(np.array(loaded_validation_waffles))

test_data = np.array(test_data)
validation_data = np.array(validation_data)

Затем я хочу создать ImageDataGenerator для моих данных:

train_datagen = ImageDataGenerator( 
    rescale=1. / 255, 
    shear_range=0.2, 
    zoom_range=0.2, 
    horizontal_flip=True) 

test_datagen = ImageDataGenerator(rescale=1. / 255) 

train_generator = train_datagen.flow( 
    #how can I pass here test_data to make it work (along with which parameters)
) 

validation_generator = test_datagen.flow(
    #how can I pass here validation_data to make it work (along with which    parameters)
) 

Как этого добиться? Я пытался так:

train_generator = train_datagen.flow( 
    test_data,                                  #does not work
    batch_size=batch_size) 

validation_generator = test_datagen.flow( 
    validation_data,                            #does not work
    batch_size=batch_size) 

но потом я получаю эту ошибку:

Traceback (most recent call last):
...

ValueError: ('Input data in `NumpyArrayIterator` should have rank 4. You passed an array with shape', (2, 770, 224, 224, 3))

Ответы [ 2 ]

1 голос
/ 27 октября 2019

Трудно сказать, что не работает без сообщения об ошибке, но я предполагаю, что проблема в том, что вы передаете списки вашим ImageDataGenerators. Вы можете легко это исправить, преобразовав свои списки в numpy-массивы:

test_data = list()
validation_data = list()

test_data.append(np.array(loaded_test_donuts))
test_data.append(np.array(loaded_test_waffles))
validation_data.append(np.array(loaded_validation_donuts))
validation_data.append(np.array(loaded_validation_waffles))

test_data = np.array(test_data)
validation_data = np.array(validation_data)

Правка: лучший способ, укладка вместо добавления в списки и преобразование

test_data = np.vstack((np.array(loaded_test_donuts),np.array(loaded_test_waffles)))

validation_data = np.vstack((np.array(loaded_validation_donuts),np.array(loaded_validation_waffles)))
0 голосов
/ 27 октября 2019

Я бы порекомендовал вам создать папку, в которой у вас есть n папок, представляющих ваши классы, такие как «собака», «кошка», и сначала выполнить шаг предварительной обработки, а затем сохранить полученные изображения следующим образом:

from PIL import Image
import glob
from keras.preprocessing import image


W=500
H=825

for folder in glob.glob("*"):     #goes through every folder 
ims = glob.glob(folder+ "\\*.png")   #reads image names from folder assuming images are png
for im in ims:  
    img = Image.open(im)
    print(im)
    if (img.size != (W, H)):
        imgr = process(img, W, H) # where "process" is reszing in your case
        imgr.save(im)

затем поместил ваши данные в папки поездов и проверки и выполните:

traingen = image.ImageDataGenerator(rescale=1./255)
validationgen = image.ImageDataGenerator(rescale=1./255)

train = traingen.flow_from_directory("train",target_size=(H,W), batch_size=s,shuffle=True)
val = validationgen.flow_from_directory("validation",target_size=(500, 825), batch_size=32, shuffle=False)
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...