Я пытаюсь оценить производительность моей модели CNN для проблемы двоичной классификации, но я обнаружил, что создание переменной, в которой хранятся истинные значения моего набора проверки (который я также использую в качестве набора тестов), дает только блок последовательных (около 2000) единиц, а затем еще один блок последовательных (еще 2000) единиц.
Я попытался сделать следующий код:
true_classes = validation_generator.classes
Я использовал flow_from_directory для создания этого validation_generator, поэтому мои два класса в тестовой папке были в отдельных папках. Я также установил shuffle на False.
Если блоки последовательных 0 и 1 не являются ошибкой, то моя модель возвращает явно неправильные значения. Это не имеет смысла для меня, так как моя точность обучения и проверки близки к 0,90, и между двумя классами в наборах данных обучения и проверки примерно 50-50 баллов.
Первые предсказанные значения выглядят так:
array([[9.9855131e-01],
[2.0859720e-01],
[9.9828231e-01],
[9.9997902e-01],
[7.6309514e-01],
[4.6643823e-01],
[3.4184277e-01],
[4.5171288e-01],
[4.5124424e-01],
[9.6602237e-01],
В заключение, может ли кто-нибудь подтвердить, должен ли validation_generator.classes возвращать последовательные блоки 0 и 1? Если нет, то как я могу получить доступ к реальным значениям моего validation_set?
Спасибо