Я работаю с некоторыми моделями YOLO на тестовом видео, чтобы классифицировать людей в кадре. Естественно, всякий раз, когда в кадре присутствует зеркало, сеть обнаружения объектов идентифицирует человека и все его отражения, поэтому, если бы я хотел посчитать людей в комнате с двумя зеркалами, 1 человек будет считаться как 3.
Есть ли возможный обходной путь для этого? Также возможно ли избежать добавления еще одного CNN в конвейер?
Пример изображения для справки