Как обучить модели SSD в Tensorflow Mobile / Lite - PullRequest
0 голосов
/ 27 апреля 2018

У меня есть набор данных 300 * 300 изображений вместе с коробками и метками объектов на них. Я хочу использовать сеть SSD для обнаружения этих объектов на изображениях. Я также хочу сделать это на мобильных устройствах, поэтому мне нужна последняя модель, совместимая с TF Mobile / Lite. Вопрос: с чего мне начать?

Я знаю, что SSD поддерживается TF Mobile / Lite (см., Например, https://github.com/tensorflow/tensorflow/issues/15633). И я считаю, что должна быть необученная модель твердотельного накопителя для TF, которую мне просто нужно обучить в моем собственном наборе данных. Но я мог найти только предварительно обученных. Я также не смог найти учебник, который объясняет, как нужно обучать существующие модели на своем собственном наборе данных.

Итак, чтобы быть более точным:

  1. Мое предположение, что я должен получить не обученную модель и обучить ее на своем собственном наборе данных с помощью простого сценария, верно?
  2. Если да , тогда где я могу взять эту модель и учебный скрипт?
  3. Нужно ли обучать его, используя настольный TF, а затем конвертировать в модели Mobile / Lite?

1 Ответ

0 голосов
/ 27 апреля 2018

1) Если у вас нет большого количества данных, нет, ваше предположение неверно. Большинство приложений сегодня начинаются с модели, предварительно обученной в Imagenet, а затем настраивают ее в соответствии с вашим набором данных. Причина этого заключается в том, что, хотя набор данных отличается, многие функции, извлеченные из Imagenet, также полезны для нового набора данных, поэтому вы можете точно настроить его, избегая необходимости иметь огромные объемы данных (и много времени / вычислительных мощностей). ).

2) Хранилище моделей тензорного потока *1003* - это то, что нужно посмотреть. Обратите внимание, что архитектура графика и весовые коэффициенты разделены, поэтому, если вы решите начать с нуля, просто не загружайте весовые коэффициенты при начале обучения.

3) Да, tflite - это оптимизированная среда выполнения, ориентированная на мобильные устройства, график все еще обучается на рабочих столах с обычным Tensorflow, заморожен, а затем вы можете использовать файл .pb замороженного графика в своем приложении, созданном с помощью tflite. Для получения более подробной информации о том, как сделать все это, вы должны проверить веб-сайт Tensorflow, у них есть много руководств, охватывающих каждый шаг (а подробно описать все из них здесь просто невозможно).

...