Я должен классифицировать картинки как содержащие определенный объект или нет. Допустим, я должен определить, есть ли на снимке со спутника лодка. У меня есть только 125 известных лодок в наборе данных, представляющих интерес. Я считаю, что этого недостаточно даже при использовании предварительно обученного нейрона net.
Итак, у меня есть идея обучить мою собственную сверточную нейронную net или переподготовку предварительно обученной, используя спутниковые снимки набора данных лодки (10 000 снимков) на kaggle в качестве экстрактора признаков. Поэтому я создаю нейронный net, который пытается воссоздать сглаженное изображение из последнего сглаженного сверточного слоя (мои особенности).
Есть ли какие-нибудь подсказки или хитрость, чтобы нейрон net сконцентрировался на объекте оценки, а не на фоне? И это, как известно, терпит неудачу или работает?