Мне нужно выполнить обнаружение объектов, используя глубокое обучение на «огромных» изображениях, скажем, 10000x10000 пикселей.
В какой-то момент в рабочем процессе мне нужно изменить размеры изображений до чего-то более управляемого, например, 640x640. На данный момент я достигаю этого, используя opencv:
import cv2
img = cv2.imread("some/path/to/my/img")
h, w = 640, 640
img = cv2.resize("some/path/to/my/img_resized", (w,h))
Теперь, когда я пытаюсь посмотреть на некоторые из этих картинок (например, чтобы проверить, что мои ограничивающие рамки четко определены) моим человеческим глазом, Я «ничего не вижу» в том смысле, что изменение размера настолько агрессивно, что изображение сильно пикселировано.
Не вызывает ли это проблемы при обучении алгоритму? Потому что, в конце концов, я могу вернуть ограничивающие рамки, выведенные моделью, к исходному изображению (100000x10000px), используя некоторое преобразование. Это не проблема. Но я не могу сказать, приводит ли что-то к go неправильной работе с такими пиксельными изображениями во время тренировки?