Как я могу изменить значение "maxdets" в Faster R-CNN от Pytorch? - PullRequest
0 голосов
/ 04 мая 2020

Я внедряю более быструю сеть RCNN на pytorch. Я следовал следующему уроку.

https://pytorch.org/tutorials/intermediate/torchvision_tutorial.html

Есть изображения, в которых у меня есть более 100 объектов для классификации. Однако в этом уроке я могу обнаружить только максимум 100 объектов, поскольку параметр "maxdets" = 100.

Есть ли способ изменить это значение, чтобы адаптировать его к моему проекту?

IoU metric: bbox
 Average Precision  (AP) @[ IoU=0.50:0.95 | area=   all | maxDets=100 ] = 0.235
 Average Precision  (AP) @[ IoU=0.50      | area=   all | maxDets=100 ] = 0.655
 Average Precision  (AP) @[ IoU=0.75      | area=   all | maxDets=100 ] = 0.105
 Average Precision  (AP) @[ IoU=0.50:0.95 | area= small | maxDets=100 ] = -1.000
 Average Precision  (AP) @[ IoU=0.50:0.95 | area=medium | maxDets=100 ] = 0.238
 Average Precision  (AP) @[ IoU=0.50:0.95 | area= large | maxDets=100 ] = -1.000
 Average Recall     (AR) @[ IoU=0.50:0.95 | area=   all | maxDets=  1 ] = 0.006
 Average Recall     (AR) @[ IoU=0.50:0.95 | area=   all | maxDets= 10 ] = 0.066
 Average Recall     (AR) @[ IoU=0.50:0.95 | area=   all | maxDets=100 ] = 0.331
 Average Recall     (AR) @[ IoU=0.50:0.95 | area= small | maxDets=100 ] = -1.000
 Average Recall     (AR) @[ IoU=0.50:0.95 | area=medium | maxDets=100 ] = 0.331
 Average Recall     (AR) @[ IoU=0.50:0.95 | area= large | maxDets=100 ] = -1.000

Если только изменить следующий параметр, будет ли решена проблема?

cocoeval.Params.setDetParams.maxDets = [1, 10, 100]

Спасибо!

1 Ответ

0 голосов
/ 05 мая 2020

"Есть изображения, в которых у меня есть более 100 объектов для классификации."

maxDets = 100 не означает, что он будет классифицировать только 100 изображений, но относится к % AverageRecall given 100 detections per image

inshort maxDets рассчитывается по метрикам не актуально нет. классифицированных изображений.

для получения дополнительной информации посетите: http://cocodataset.org/#detection -eval

Отзыв графика Tensorboard

https://github.com/matterport/Mask_RCNN/issues/663

 # Limit to max_per_image detections **over all classes**
    if number_of_detections > self.detections_per_img > 0:
        cls_scores = result.get_field("scores")
        image_thresh, _ = torch.kthvalue(
            cls_scores.cpu(), number_of_detections - self.detections_per_img + 1
        )
        keep = cls_scores >= image_thresh.item()
        keep = torch.nonzero(keep).squeeze(1)
        result = result[keep]
    return result

в соответствии с этим фрагментом кода я обнаружил, что он проверяет номер. обнаружения, так что model.roi_heads.detections_per_img=300 является правильным для вашей цели. И я не нашел много надлежащей документации по maxdets, но я думаю, что приведенный выше код должен работать.

 # non-maximum suppression, independently done per class
   keep = box_ops.batched_nms(boxes, scores, labels, self.nms_thresh)
 # keep only topk scoring predictions
   keep = keep[:self.detections_per_img]

этот фрагмент кода говорит о том, что мы можем отфильтровать только некоторые главные обнаружения, которые мы хотим иметь в нашей модели.

...