Сходство изображений / детектор рециркуляции - PullRequest
0 голосов
/ 13 марта 2020

Вопросы об обнаружении сходства изображений регулярно возникают. Решения во многом зависят от того, что в прецеденте определяется как сходство, поэтому мне трудно найти подходящую мне библиотеку. Поэтому ниже я опишу свой вариант использования и надеюсь, что кто-то может направить меня в правильном направлении.

Я пытаюсь организовать своего рода защиту от мошенничества / поиск. Мошенники на ebay / craigslist часто перерабатывают изображения, взятые из реальных предложений. Я хочу локально кэшировать изображения из предложений, которые могут заинтересовать меня (на основе поиска по ключевым словам). Затем, когда появляются новые предложения, я хочу добавить их в свою библиотеку и сравнить изображения с изображениями, которые уже находятся в библиотеке. Обратный поиск Google делает это, но зависит от изображений, которые все еще онлайн или в кеше. Он также очень мощный, потому что обладает невероятно огромной библиотекой изображений, с которой нужно сравнивать, а также пытается назвать сфотографированный объект. Мне это не нужно, размер библиотеки не должен превышать 10 тыс. Записей, поэтому я надеюсь, что локальное решение с открытым исходным кодом доступно.

Как бы я определил «подобное» для этого варианта использования : - Точное изображение / файл используется повторно - Точное изображение, но сжато повторно или в другом формате изображения - Легкие вырезы (вырез 1000x1000 пикселей из изображения 1024x1024) - Поворот на 90 ° - Зеркальный

Я ищу библиотека с открытым исходным кодом, которая делает это. Производительность не является супер важной, поскольку результаты будут кэшироваться. В идеале я хочу связать это с java, в лучшем случае это можно запустить на Raspberry Pi.

...