Обнаружение наложения в видео с питоном - PullRequest
3 голосов
/ 28 мая 2019

Я работаю с кадрами из видео. Видео наложено на несколько полупрозрачных прямоугольников, и моя цель - найти координаты этих прямоугольников. Эти поля являются единственными фиксированными точками в видео - камера движется, интенсивность цвета меняется, нет фиксированной привязки. Проблема в том, что поля полупрозрачны, поэтому они также меняются вместе с видео, хотя и не так сильно. Кажется, что ни фоновое вычитание, ни отслеживание не имеют подходящих инструментов для этой проблемы.

Тем не менее, я пробовал фоновые субстракторы, которые поставляются с cv2, а также некоторые домашние методы, использующие различия между фреймами и порогом. К сожалению, они не работают из-за прозрачности окна.

Для справки, вот как выглядит средняя разница между первыми 50 кадрами:

mean difference between frames

А вот то, что возвращает фоновый вычитатель cv2 KNN:

background subtractor result

Я экспериментировал с пороговыми значениями, количеством учитываемых кадров, различными алгоритмами контурной обработки, размытием / резкостью и т. Д. Я также попробовал методы из анализа макета документа.

Интересно, может быть, я что-то упускаю из-за того, что не знаю правильного ключевого слова. Я не ожидаю, что кто-нибудь здесь даст мне идеальное решение, но любые указания относительно того, где искать / какой подход попробовать, приветствуются. Я также не связан с cv2, все, что работает в python, подойдет.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...