Исходя из небольшой информации, которую вы предоставляете, выбор сетевой архитектуры должен быть последним из ваших вопросов. Также «пробовать нормальные алгоритмы обработки изображений» - довольно расплывчатое утверждение.
Несколько моментов для рассмотрения
- Насколько велик набор данных? Шоколадные фотографии, сделанные в контролируемой обстановке, где они всегда похожи на ваши примеры фотографий, или они сделаны в дикой природе, то есть где они могут иметь различные условия освещения, положения и т. Д.? Сбалансирован ли набор данных?
- Как маркируется набор данных? Это просто класс для всего изображения, указывающий нормальное или ненормальное? Если это так, то вы просто выполняете классификацию, и один из способов просто визуализировать расположение царапин (если они оказываются наиболее заметной особенностью классификации) - это использовать карты активации градиентно-взвешенных классов. С другой стороны, если ваш набор данных помечен точками царапин на изображениях, вы можете напрямую обучить свою сеть выводить тепловые карты.
После того, как ваш набор данных правильно настроен с набором обучения и проверки, выможно просто начать с базовой простой небольшой сверточной сетевой архитектуры, а затем попробовать другие и более крупные сетевые архитектуры, такие как VGG16, ResNet и т. д., и проверить, улучшают ли они производительность вашего проверочного набора.