Как выбрать модель CNN для конкретного случая использования? - PullRequest
0 голосов
/ 23 апреля 2020

Итак, я нахожусь на этапе сбора требований для реализации проекта CNN для варианта использования. Мне не терпится узнать, как подобрать подходящую модель для конкретного случая использования в индустрии AI / ML. Я видел, что есть много архитектур CNN, но как выбрать, какая архитектура будет соответствовать моим требованиям?

Это делается только методом проб на основе ошибок или существует какой-либо конкретный c метод выбора правильной архитектуры? Если это пробный процесс по ошибке, разве это не громоздко? Если нам нужно использовать только метод проб за ошибкой, как долго это нам поможет?

Ответы [ 2 ]

0 голосов
/ 24 апреля 2020

Обычно у вас есть некоторые ограничения, которые помогут вам сузить выбор. Например, если вам необходимо разработать приложение для мобильного устройства, вам лучше всего выбрать архитектуры MobileNets или Shuffl eNet. Вы можете проверить производительность каждой модели-кандидата на наборе валидации ILSVR C и получить представление об их относительной эффективности. Оттуда вы можете выбрать модель, которая наилучшим образом соответствовала вашим ограничениям (доступный ресурс обучения, ограничение времени / памяти при выводе). Если вы используете трансферное обучение, вам нужно будет решить, сколько слоев заморозить. Хотя это будет зависеть от ваших тренировочных данных (больше данных означает, что вы можете отрегулировать больше слоев без риска переоснащения), все еще существуют некоторые испытания и ошибки. Затем, исходя из количества времени и ресурсов, вы можете исследовать другие модели.

0 голосов
/ 23 апреля 2020

Говоря об архитектуре, вы имеете в виду

  1. VGG16
  2. Re snet (от Microsoft)
  3. Inception (от Google) et c. ,

Все вышеперечисленное построено различными группами для участия в image- net wiki соревновании, которое происходит каждый год. Каждая архитектура соответствует только одному варианту использования для классификации изображений среди 1000 различных категорий . Итак, я не думаю, что архитектуры могут быть дифференцированы в зависимости от варианта использования. При этом вы можете рассматривать архитектуру по следующим критериям:

  1. Точность моделей, построенных с использованием разных архитектур (наивысшая из лучших)
  2. А также то, насколько хорошо она обобщается на тесте / новые входящие данные, что также очень важно.
  3. Время обучения и ограничения памяти GPU (VGG16 довольно прост и обучается быстро, но два других, упомянутых выше, имеют много слоев)
  4. Сложность модель
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...