Я хочу реализовать приложение, способное распознавать изображения с камеры. Я не имею в виду classification
объектов, а скорее определяю точное единственное изображение из данного набора изображений. Так, если у меня, например, есть альбом с 500 фотографиями, то, если я наведу камеру на одну из них, приложение сможет определить имя файла. Большинство учебных пособий, которые я нахожу о CoreML
, предназначены исключительно для классификации изображений (распознавания класса объекта), а не для распознавания точного имени изображения в камере. Это также должно работать с разных сторон, и все, что я могу иметь для обучения сети, - это альбом с множеством разных картинок (одна картинка для одного объекта). Можно ли это как-то достичь? Я не могу использовать ARKit Image Tracking
, потому что таких изображений будет около 500, и мне нужно сначала найти хотя бы список похожих изображений с CoreML
/ Vision
.