У меня есть задача классификации, где я пытаюсь определить, скажем, является ли «приложение» успешным или неудачным на основе изображений документа. Вместо того, чтобы классифицировать одно изображение, одно приложение может иметь один или несколько документов. Данные выглядят примерно так:
Application_1 (PASS)
- document1.jpg
- document2.png
Application_2 (PASS)
- document1.jpg
Application_3 (FAIL)
- document1.jpg
- document2.jpg
- document3.jpg
- document4.jpg
Каждое приложение имеет метку «годен / не годен» на основе содержимого документа, например, паспорт может пройти сам по себе, лицензия + рекомендательное письмо может пройти, но сама лицензия не может пройти.
У меня есть классификатор на основе текста из документов, но содержание изображения важно. Можно ли обучить CNN, где вводом является произвольное количество изображений, а не одно?