Какой внешний алгоритм используется для генерации гипотез в Fast R-CNN и SPP-сети? - PullRequest
2 голосов
/ 03 апреля 2019

Я понял, что нам нужен выборочный поиск в качестве внешнего алгоритма для генерации предложений области интереса в R-CNN, но в Fast R-CNN мы можем просто взять все изображение, а затем передать его в сверточную сеть для создания карту объектов, а затем использовал один слой SPP (слой пула RoI).

С другой стороны, в SPP-сети мы использовали многослойный SPP. Для быстрого ознакомления и понимания enter image description here

В обоих медленных R-CNN, SPP-net и Fast R-CNN интересующая область (RoIs) была из метод предложения ("выборочный поиск", ??, ?? соответственно).

Может ли кто-нибудь объяснить подробно и процитировать какие методы предложения явно используются в SPP-net & Fast R-CN, так как , я не нашел, чтобы это было явно упомянуто в исследовательские работы в деталях?

1 Ответ

2 голосов
/ 03 апреля 2019

Официальный репозиторий github показал, что и SPP-net, и Fast R-CNN использовали тот же метод предложения региона, что и R-CNN, а именно «выборочный поиск»:

SPP_net и Fast R-CNN . В репозитории SPP_net имеется модуль выборочного поиска для предложений по регионам, в быстром репо r-cnn автор специально упомянул способ вычисления предложений по объектам - выборочный поиск.

Но опять же, для создания предложений по регионам могут также использоваться другие методы, поскольку R-CNN и Fast R-CNN приняли методы предложения объектов как внешние модули, независимые от детекторов .

Вообще говоря, если метод генерирует больше предложений, он может повысить конечную точность обнаружения, но это, конечно, ограничит скорость обнаружения. В разделе Faster R-CNN *1014* «Связанные работы» содержится краткое описание всех методов создания предложений объектов.

Что касается последующего вопроса, а именно, как интуитивно представить предложения регионов в карте объектов, это можно лучше проиллюстрировать на следующем рисунке ( ref ): image_ref

На рисунке красный прямоугольник слева после сверточной операции станет красным квадратом в выходном объеме справа, а зеленый прямоугольник соответствует зеленому квадрату и т. Д. Теперь представьте, что все 7x7 слева предложение региона, затем на выходной карте объектов, это все еще предложение региона! Конечно, в действительности изображение слева имеет гораздо больше пикселей, поэтому может быть много предложений по регионам, и каждое из этих предложений все равно будет выглядеть как предложение региона на выходной карте объектов!

Наконец, в оригинальной статье SPP_net автор объясняет, как именно они выполняли преобразование предложений регионов из исходного изображения в окна-кандидаты на карте объектов. enter image description here

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...