Question

Я хочу реализовать приложение, способное распознавать изображения с камеры. Я не имею в виду classification объектов, а скорее определяю точное единственное изображение из данного набора изображений. Так, если у меня, например, есть альбом с 500 фотографиями, то, если я наведу камеру на одну из них, приложение сможет определить имя файла. Большинство учебных пособий, которые я нахожу о CoreML, предназначены исключительно для классификации изображений (распознавания класса объекта), а не для распознавания точного имени изображения в камере. Это также должно работать с разных сторон, и все, что я могу иметь для обучения сети, - это альбом с множеством разных картинок (одна картинка для одного объекта). Можно ли это как-то достичь? Я не могу использовать ARKit Image Tracking, потому что таких изображений будет около 500, и мне нужно сначала найти хотя бы список похожих изображений с CoreML / Vision.

alift · Answer 1 · 14 января 2020

Я не уверен, но думаю, перцептивное хеширование может помочь вам. Он работает таким образом, что он делает некоторые отпечатки пальцев с эталонных изображений, и для данного изображения, он также извлекает отпечатки пальцев, а затем вы можете найти самые похожие отпечатки пальцев.

таким образом, даже если новое изображение не на 100% соответствует изображению в наборе данных, его все равно можно обнаружить.

На самом деле это не очень сложно реализовать. но если вы хотите, я думаю, что библиотека pha sh является хорошей для использования.

CoreML Image Detection

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

CoreML Image Detection

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Похожие темы