Обнаружение объекта Tensorflow: обрезка больших входных изображений в тайлы - PullRequest
0 голосов
/ 09 января 2020

У меня перекошенное изображение размером 1100x250 пикселей и несколько небольших надписей с размерами 30x30. Моя модель кокоса не очень хорошо тренируется, возможно, потому, что все размеры уменьшены до 300x300.

Некоторые люди на inte rnet предлагают обрезать мои тренировочные изображения, чтобы они были ближе к 300x300 (поэтому делаю плитки из моей фотографии), и, конечно, создайте соответствующие файлы аннотаций.

Однако я не нахожу официальной информации об этом, ни научных c статей. Это путь к go?

  • Показываю ли я все плитки своей модели во время тренировки, хотя я знаю, что там нет объектов? (без аннотаций) Или я показываю только плитки с ограничивающими рамками?
  • Равномерно ли обрезается при разрешении 300x300, что делает последнюю плитку меньше (таким образом, растягивается больше, чем остальные)? Или я пытаюсь сохранить соотношение сторон одинаковым для каждой плитки?
  • Нужно ли больше тренировочных образцов на плитку? Прямо сейчас у меня есть около 500 изображений с надписью, но на всем протяжении 1100 пикселей. Нужно ли мне 500 экземпляров на плитку?
  • Кто-то предложил обрезать 300x300 вокруг каждого помеченного объекта, но, по-моему, тензор потока просто узнает: «О, он всегда в середине», а это не то, что я хочу

Спасибо за помощь, я чувствую, что это немного недооценено на inte rnet.

...