Проблемы, связанные с объединением RoI на карте объектов изображения - PullRequest
0 голосов
/ 30 июня 2019

Я изучил различные проблемы, связанные с пулами RoI карты объектов, и все же я не смог правильно закодировать ее в Keras.

Я использовал код, доступный в этом хранилище , но столкнулся с некоторыми проблемами совместимости.

Я извлекаю карту объектов из предварительно обученной модели VGG 16, и у меня есть мои ограничивающие рамки RoI из слоя RPN, как описано в документе Faster R-CNN, но я не могу закодировать слой объединения RoI.

Может ли кто-нибудь предоставить рабочий код или исходный код для разработки того же самого?

Реализация Tensorflow также высоко ценится. Если требуется другая информация, пожалуйста, оставьте комментарий.

Код для справки приведен ниже:

model = VGG16()

feature_map=model.predict(img)

feature_map = np.asarray(feature_map, dtype='float32')

rois_value = [
    [0, 0, 0, 1, 3],
    [0, 2, 2, 3, 3],
    [0, 1, 0, 3, 2]
]

rois= np.asarray(rois_value, dtype='int32')

rpooling = roi_pooling(feature_map, rois, 7, 7)

#roi_pooling will be the function that takes feature-map, the roi bounding box coordinates(the later four being startx, starty, width, height) and pooling height and pooling width.

...