Изменение размера больших изображений для обнаружения объектов - PullRequest
0 голосов
/ 12 февраля 2020

Мне нужно выполнить обнаружение объектов, используя глубокое обучение на «огромных» изображениях, скажем, 10000x10000 пикселей.

В какой-то момент в рабочем процессе мне нужно изменить размеры изображений до чего-то более управляемого, например, 640x640. На данный момент я достигаю этого, используя opencv:

import cv2
img = cv2.imread("some/path/to/my/img")
h, w = 640, 640
img = cv2.resize("some/path/to/my/img_resized", (w,h)) 

Теперь, когда я пытаюсь посмотреть на некоторые из этих картинок (например, чтобы проверить, что мои ограничивающие рамки четко определены) моим человеческим глазом, Я «ничего не вижу» в том смысле, что изменение размера настолько агрессивно, что изображение сильно пикселировано.

Не вызывает ли это проблемы при обучении алгоритму? Потому что, в конце концов, я могу вернуть ограничивающие рамки, выведенные моделью, к исходному изображению (100000x10000px), используя некоторое преобразование. Это не проблема. Но я не могу сказать, приводит ли что-то к go неправильной работе с такими пиксельными изображениями во время тренировки?

1 Ответ

1 голос
/ 13 февраля 2020

Это действительно зависит от того, какая информация теряется при изменении размера. От 10000x10000 до 640x640 я бы предположил, что потеряно почти все, что имеет отношение к делу, что делает проблему намного сложнее, если вообще решаемо. Если вы не можете решить проблему (видя объекты на измененном изображении), это очень плохая отправная точка для решения проблемы с нейронной сетью. Я все равно попробую посмотреть, если сеть что-нибудь сделает.

Вероятно, это не сработает. Простой способ решить эту проблему - разбить исходное изображение на участки и выполнить их обнаружение и объединить результаты. Это может работать, но в зависимости от проблемы может быть недостаточно.

Если этого недостаточно для вашей проблемы, вы можете провести какое-то современное исследование и попытаться найти кого-то с подобной проблемой. Я знаю, что медицинские изображения также могут быть довольно большими. Также люди, имеющие дело со спутниковыми изображениями, могут иметь ту же проблему очень больших входных изображений и, возможно, придумали способы решить эту проблему.

...