У меня есть классификатор VGG16
, и я кормлю его обрезками изображения, полученного путем деления изображения на сетки (3x3). Таким образом, я ввожу в последовательности 9 урожаев одинакового размера (224x224)
и для каждого урожая, собираю выходные данные fc7
, формы (4096,)
и сохраняю их.
Затем я объединяю 9 выходов в Тензор формы (9, 4096,)
и подаю его в LSTM, который угрожает 9 посевам как временные шаги.
Это поток одного изображения, но, конечно, у меня есть несколько изображений. Поэтому мне нужно обработать 9 кадрирований на изображение, сохранить все карты объектов и затем создать новый набор данных, который состоит из всех конкатенаций.
Есть ли способ сделать это сквозным? Таким образом, в основном обрабатываете 9 урожаев за один раз и вводите Тензор размером (9,4096,)
непосредственно во вторую часть сети?
Я использую Keras с бэкэндом Tensorflow.