Производительность MaskRCNN / YOLO как функция размера объекта в пикселях - PullRequest
1 голос
/ 10 января 2020

Я пытаюсь найти ссылки на то, как разрешение объекта влияет на способность систем обнаружения объектов, таких как MaskRCNN и YOLO, правильно идентифицировать объект.

Например, если камера увеличивается и дальше количество пикселей, составляющих объект, будет уменьшаться, и в итоге объект будет занимать всего один пиксель. На данный момент алгоритм может использовать только значения этого одного пикселя, и поэтому маловероятно, что даже очень точный алгоритм сможет обнаружить. Я надеюсь найти какую-либо справку о том, как снижается производительность при уменьшении пикселей на объект.

1 Ответ

1 голос
/ 10 января 2020

Во-первых, я думаю, что экспериментальные результаты в большинстве работ по обнаружению объектов подтверждают вашу интуицию, что более низкое разрешение приводит к более низкой точности обнаружения. Например, если вы посмотрите на AP-S, AP-M, AP-L (* т. Е. Среднюю точность для малых, средних и крупных объектов) в экспериментальных результатах бумаг для обнаружения объектов, таких как Yolov3 (таблица 3), вы заметите Огромное падение AP-S по сравнению с AP-M и AP-L, особенно для одноразовых методов.

Во-вторых, я думаю, что хорошей отправной точкой для получения экспериментальной поддержки вашего утверждения является использование набор данных coco и немного изменить скрипты cocoeval, которые поставляются с cocoapi (если я не ошибаюсь, те, которые находятся в cocoapi / PythonAPI / pycocotools /). Как указано в документации, значения по умолчанию для малых, средних и крупных объектов выглядят следующим образом:

APsmall
AP for small objects: area < 32^2
APmedium
AP for medium objects: 32^2 < area < 96^2
APlarge
AP for large objects: area > 96^2

Вы можете начать с зацикливания порога малых объектов, начав с 32^2 и уменьшая его до достижения некоторой минимальной площади, и посмотрите, как показатель AP-small уменьшается как функция этого порога. Это может привести к уменьшению кривой, которая проиллюстрирует вашу точку зрения.

...