Люди, проводящие академические исследования в области глубокого обучения / компьютерного зрения, часто используют VGG16 или VGG19 в качестве базовой модели, потому что это просто и хорошо работает.К сожалению, он также имеет более 100 миллионов параметров, что делает его непригодным для использования на мобильных устройствах.
Решение здесь заключается в том, чтобы перестроить модель с использованием меньшего экстрактора функций, такого как MobileNet или SqueezeNet, и обучить его снова.Теперь у вас получится модель намного меньшего размера, от 10 до 20 МБ.
Это означает, что вы не можете просто взять модели из Интернета и конвертировать их в Core ML и ожидать, что онихорошо работать.Это требует немного больше работы, чем это!