Как определить, похожи ли два текстовых изображения без распознавания текста? - PullRequest
0 голосов
/ 05 ноября 2019

Я пытаюсь сравнить два изображения с именами пользователей и проверить, совпадают ли оба. Я не могу использовать OCR Tesseract , потому что имена пользователей могут состоять из букв двух или трех разных языков. Из-за этого Tesseract не может анализировать текст с изображения. Я использовал ImageHash , чтобы попытаться выяснить, похожи ли изображения.

Но когда я пытаюсь сравнить это изображение:

first iamge

тогда ImageHash дает мне результат, что имя пользователя Mustang1202 больше похоже на это изображение, чем Mustang1203 .

Есть ли другой способ, которым я могуобнаружить похожий текст в изображениях?

1 Ответ

0 голосов
/ 05 ноября 2019

Возможно, вы захотите проверить это: https://gist.github.com/duhaime/211365edaddf7ff89c0a36d9f3f7956c Поскольку ваш шаблон относительно менее универсален, он может работать, он будет возвращать кучу разных баллов, вам может потребоваться отсортировать тот, который вам нужен,Не упустите изменение размера, это может разрушить точность. (Кстати, Google первое совпадение ... не ленитесь) Если вы не можете достичь желаемых результатов с помощью вышеизложенного, вот более «современное» решение, сверточный автоэнкодер должен сделать свое дело, но вы можете попробоватьиз двух других подходов. https://github.com/ankonzoid/artificio/tree/master/image_retrieval

...