Я передаю изображение размером 227x227 пикселей в AlexNet и хочу найти выходные данные изображения в определенной точке архитектуры (после 2-го сверточного слоя), которая соответствует определенному фрагменту входного изображения.
Архитектура AlexNet здесь для незнакомых. Я смотрю на выход модели после Conv2 + Relu (который идет после Conv1 + Relu и затем Max Pooling).
Итак, допустим, мой ввод - это массив nampy 227x227 img
, а мой патч - 100 пикселей img[10:20,10:20]
. Мой вывод out
имеет размеры 28x28x256. Как бы я выяснил, какие пиксели на выходе соответствуют моему патчу?