Мы разрабатываем приложение для семантической сегментации для ПК и мобильной платформы. Изначально мы опробовали современную платформу DeeplabV3 + от google. В качестве набора данных использовались POCAL VOC и была выполнена модель из официальной модели зоопарка.очень хорошо с точки зрения точности (тензорный поток). Производительность модели на ПК и мобильных устройствах (в пересчете на coreml и tflite) не была удовлетворительной в соответствии с нашими требованиями. Несмотря на то, что мы пробовали разные методы оптимизации и квантования моделей, мы не смогли достичьхороший баланс между производительностью и точностью.
Однако на самом деле нас интересует только сегментация одного класса (в пределах PASCAL VOC). Но модель вычисляет маску сегментации для каждой метки класса, которая, кажется,быть избыточным в нашем случае. Так что, если мы обучим сеть только с одним классом (дополнительный фон), это улучшит производительность с точки зрения скорости?