У меня есть несколько видео, которые следует рассматривать как основную правду для обнаружения людей: это пример .
У меня также есть скрепленное видео (без каких-либо обнаружений), и мне нужно запустить алгоритм детектора людей и сравнить мои результаты с наземным видео правды.
Проблема в том, что я хотел бы иметь не только качественное сравнение, но и количественное . Поэтому, поскольку я могу подсчитать количество обнаружений в моем личном алгоритме, я должен найти надежный способ подсчитать количество ограничивающих рамок, которые появляются в видео истинной реальности для каждого кадра.
Я учел эту ссылку и эту либо , но они предназначены для нахождения контуров фигуры, а не ограничивающего прямоугольника. Я знаю, что может показаться бессмысленным определять количество обнаружений, но это единственный способ получить числовую правду.