Я использую pandas для использования файла .txt и flow_from_dataframe, чтобы помочь мне читать изображения из папок.
Это мой код:
import keras
import pandas as pd
from keras_preprocessing import image
from keras.preprocessing.image import ImageDataGenerator
datagen = image.ImageDataGenerator(rescale=1./255)
data = pd.read_csv('/directory/clipart_train.txt', sep=" ", header=None)
data.columns = ["id", "labels"]
print(data)
print(data["id"].shape)
print(data["labels"].shape)
data["labels"] = data["labels"].astype('str')
print(data["labels"].dtype)
train_generator=datagen.flow_from_dataframe(
dataframe = data,
directory = "/directory/",
x_col = "id",
y_col = "labels",
target_size=(224,224),
class_mode = 'categorical',
batch_size = 1
)
Я получаю следующий формат: [11372 строк x 2 столбца], и команда печати показывает «метки» в диапазоне от 0 до 204.
Но Flow_from_dataframe выдает «Найдено 11372 изображений, принадлежащих 181 классу».вместо 205 классов.Я что-то упустил?
edit: Проблема не возникает с данными проверки с похожим кодом (найдено 1954 изображений, принадлежащих к 204 классам).