Можем ли мы использовать модель, обученную классификации изображений, чтобы помочь в обнаружении объектов в тензорном потоке? - PullRequest
0 голосов
/ 17 июня 2019

Я использовал Tensorflow-for-poets для построения модели классификации изображений.Однако теперь я хочу использовать обученную модель в модели обнаружения объектов.Могу ли я просто импортировать файлы .pb напрямую или мне нужно переобучить модель?

Я получаю эту ошибку при попытке

KeyError: «Имя» image_tensor:0 'обозначает тензор, который не существует. Операция' image_tensor 'не существует в графе. "

1 Ответ

2 голосов
/ 17 июня 2019

Вы не можете напрямую использовать модель .pb, созданную в результате классификации изображений, для обнаружения объектов. Вам нужно будет получить модель обнаружения объекта, обучить ее, а затем использовать ее для обнаружения. В модели обнаружения объектов Tensorflow zoo .

имеются модели обучения предварительно обученных объектов.

подробный ответ ниже:

Классификация изображений и обнаружение объектов - две разные, но очень тесно связанные задачи. На самом деле, Росс Гиршик задал похожий вопрос на известной газете R-CNN

В какой степени результаты классификации CNN в ImageNet обобщаются на результаты обнаружения объектов в PASCAL VOC Challenge?

Этот вопрос в основном означает, что модель классификации изображений может использоваться для помощи в обнаружении объектов, но необходимо выполнить еще несколько шагов. Таким образом, вы не можете просто напрямую использовать сеть классификации для выполнения задачи обнаружения объекта. (Но ошибка, которую вы дали, была чем-то другим, вы можете найти правильное имя тензора и исправить ошибку, но просто не имеет смысла напрямую использовать классификационную сеть для такого обнаружения объектов.)

Существует наивное решение для объединения двух, вы можете просто использовать скользящее окно различных размеров, проходящее через изображение и выполнить классификацию, это может выполнить обнаружение объекта.

Еще одно решение интегрировано. Чтобы привести пример, Faster R-CNN - это сеть обнаружения объектов, которая использовала VGG в качестве экстрактора функций (в оригинальной статье). Здесь вы можете видеть, что VGG является сетью классификации изображений, и она предварительно обучена некоторой задаче классификации изображений.

enter image description here

источник изображения

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...