Я изучил различные проблемы, связанные с пулами RoI карты объектов, и все же я не смог правильно закодировать ее в Keras.
Я использовал код, доступный в этом хранилище , но столкнулся с некоторыми проблемами совместимости.
Я извлекаю карту объектов из предварительно обученной модели VGG 16, и у меня есть мои ограничивающие рамки RoI из слоя RPN, как описано в документе Faster R-CNN, но я не могу закодировать слой объединения RoI.
Может ли кто-нибудь предоставить рабочий код или исходный код для разработки того же самого?
Реализация Tensorflow также высоко ценится. Если требуется другая информация, пожалуйста, оставьте комментарий.
Код для справки приведен ниже:
model = VGG16()
feature_map=model.predict(img)
feature_map = np.asarray(feature_map, dtype='float32')
rois_value = [
[0, 0, 0, 1, 3],
[0, 2, 2, 3, 3],
[0, 1, 0, 3, 2]
]
rois= np.asarray(rois_value, dtype='int32')
rpooling = roi_pooling(feature_map, rois, 7, 7)
#roi_pooling will be the function that takes feature-map, the roi bounding box coordinates(the later four being startx, starty, width, height) and pooling height and pooling width.